Statistische Bioinformatik

Fakult?t

Fakult?t Agrarwissenschaften und Landschaftsarchitektur (AuL)

Version

Version 1 vom 02.09.2025.

Modulkennung

44B0757

Niveaustufe

Bachelor

Unterrichtssprache

Deutsch

ECTS-Leistungspunkte und Benotung

5.0

H?ufigkeit des Angebots des Moduls

nur Wintersemester

Dauer des Moduls

1 Semester

 

 

Kurzbeschreibung

Die statistische Bioinformatik spielt eine bedeutende Rolle in verschiedenen wissenschaftlichen Bereichen der Omics-Forschung. Sie wird nicht nur klassisch genutzt, um genetische Marker für Krankheiten oder genetische Veranlagungen in der Humangenetik zu identifizieren, sondern auch zur Entschlüsselung der genetischen Vererbung bei der Züchtung von Tieren und Pflanzen. Die algorithmische Auswertung von genetischen Daten ist sowohl biologisch umfassend als auch methodisch anspruchsvoll. Das Modul "Statistische Bioinformatik" folgt dem zentralen Dogma der Molekularbiologie, das besagt, dass Informationen von Genen zu Proteinen übertragen werden. Es beinhaltet die statistische Analyse von genetischen Markern auf DNA-Ebene sowie die Untersuchung der Genexpression über mRNA und die daraus resultierende Proteinexpression bis hin zur Ph?nomik. Auch regulatorische Elemente der DNA-Expression, wie die Methylierung, werden im Modul berücksichtigt. Das Modul "Statistische Bioinformatik" bietet zuerst eine Einführung in die klassische mendelsche Genetik sowie Grundlagen in der quantitativen Genetik. Den Gro?teil den Inhalts machen aktuelle algorithmische Verfahren zu Assoziationsstudien und Sequenzanalysen aus. Studierende erlernen somit die grundlegenden F?higkeiten für zukünftige wissenschaftliche und angewandte Arbeiten im Bereich der Omics-Forschung. Der Schwerpunkt des Moduls liegt auf der Darstellung, Verarbeitung und statistischen Auswertung von hochdimensionalen genetischen Daten. Fallstudien aus den Bereichen der Agrarwissenschaften und Humanbiologie dienen als praktische Anwendungen. Gleichzeitig werden die erworbenen theoretischen Kenntnisse durch die Auswertung von Daten in R/Bioconductor in die Praxis umgesetzt. Das Modul "Statistische Bioinformatik" legt somit den Grundstein für die methodische Auswertung von Omics-Daten.

Lehr-Lerninhalte

  • Grundlagen der klassischen, mendelschen Vererbung beinhaltend das Hardy-Weinberg-Gleichgewicht
  • Grundlagen der Quantitativen Genetik mit Kopplungskarten und Linkage disequilibrium
  • Genetische Distanz und polygenetische B?ume zur Darstellung evolution?rer Beziehungen
  • Markergestützte Selektion und indirekte Selektion
  • Statistische Herausforderungen von hochdimensionalen Daten
  • Data Preprocessing und Qualit?tskontrolle auf der Ebene der Marker und Individuen
  • G?ngige Assoziationstests unter anderem Chi-Quadrat-Test und logistische Regression 
  • Auswertung von Genomeweite Assoziationsstudien, Microarraydaten, High throughput genotyping, Next generation sequencing, Whole genome sequencing und RNA-seq an Fallbeispielen
  • Visualisierungen der Ergebnisse durch Manhattanplot, Vucanoplot und Regional Association Plot und weiteren.
  • Grundlagen Multiomics und Pathway Analysen sowie deren Datenbanken
  • Grundlegende Methoden zum Sequenzaligment
  • Anwendung der Algorithmen an ausgew?hlten Fallbeispielen in R/Bioconductor

Gesamtarbeitsaufwand

Der Arbeitsaufwand für das Modul umfasst insgesamt 150 Stunden (siehe auch "ECTS-Leistungspunkte und Benotung").

Lehr- und Lernformen
Dozentengebundenes Lernen
Std. WorkloadLehrtypMediale UmsetzungKonkretisierung
40VorlesungPr?senz oder Online-
20?bungPr?senz oder Online-
Dozentenungebundenes Lernen
Std. WorkloadLehrtypMediale UmsetzungKonkretisierung
35Veranstaltungsvor- und -nachbereitung-
20Literaturstudium-
20Sonstiges-
15Prüfungsvorbereitung-
Benotete Prüfungsleistung
  • Pr?sentation oder
  • Klausur oder
  • Hausarbeit
Prüfungsdauer und Prüfungsumfang

Pr?sentation, 20-Minuten oder Klausur, 2-stündig oder Hausarbeit max. 20 Seiten

Empfohlene Vorkenntnisse

Für dieses Modul sind Kenntnisse der deskriptiven Statistik sowie Grundkenntnisse der Statistik hilfreich aber nicht notwendig, wie sie unter anderem in den Modulen "Mathematik und Statistik (44B0266)" oder "Angewandte Statistik und Versuchswesen (44B0400)" vermittelt werden.

Studierenden, die ihre Kenntnisse und Fertigkeiten vor Beginn des Moduls auffrischen oder erweitern m?chten, wird folgende Grundlagenliteratur mit dem "Skript Bio Data Science" unter jkruppa.github.io empfohlen.

In dem Modul wird mit der Software R gearbeitet. Um sich im Vorfeld mit den Basisfunktionen vertraut zu machen, eignen sich beispielsweise die folgenden Video-Tutorials unter www.youtube.com/c/JochenKruppa.

Wissensverbreiterung

  • Die Studierenden sind in der Lage verschiedene Daten und Datenstrukturen zu den jeweiligen Omics-Verfahren zu erkennen und zu benennen.
  • Die Studierenden k?nnen das zentrale Dogma der Molekularbiologie erkl?ren und visualisieren. 
  • Die Studierenden sind in der Lage den Unterschied zwischen der quantitativen und qualitativen Genetik zu erkl?ren.
  • Die Studierenden k?nnen Omics-Abbildungen erkennen und benennen.
  • Die Studierenden k?nnen externe Programme aus R heraus starten und Ergebnisse einlesen.

Wissensvertiefung

  • Die Studierenden k?nnen explorative Abbildungen in ausgew?hlten Omics-Analysen erstellen und interpretieren.
  • Die Studierenden sind in der Lage anhand einer Omics-Analyse eine Entscheidung zu treffen.
  • Die Studierenden k?nnen das Ergebnis einer Omics-Analyse im Kontext der wissenschaftlichen Fragestellung interpretieren.   
  • Die Studierenden sind in der Lage aus englischen Tutorien eine L?sung für ein Omics-Verfahren einzugrenzen.
  • Die Studierenden k?nnen einfache Auswahl- und Filterregeln auf Datens?tze in R anwenden.
  • Die Studierenden k?nnen erste einfache R Code Bl?cke miteinander in einen Kontext setzen.

Wissensverst?ndnis

  • Die Studierenden k?nnen verschiedene Ebenen der Omics-Analysen in einen wissenschaftlichen Kontext bringen und miteinander vergleichen.
  • Die Studierenden sind in der Lage eine genetische Auswertung mit den notwendigen Funktionen und Paketen in R zu skizzieren und zu erkl?ren.
  • Die Studierenden k?nnen die einzelnen Schritte einer genetischen Analyse benennen und bei der Planung eines eigenen Experiments berücksichtigen. Sie identifizieren dabei die Probleme der jeweiligen biologischen Proben.

Nutzung und Transfer

Die Studierenden sind in der Lage einfache Kosten- und Nutzenabsch?tzungen anhand von genetischen Analysen durchzuführen. Diese einfachen Absch?tzungen umfassen die Planung von marktwirtschaftlichen, technischen und biologischen Prozesses in der Agrarwirtschaft und den Lebenswissenschaften. Sie k?nnen dabei die verschiedenen Ebenen der Omics-Foschung in den Kontext der Anwendung und der Ph?nomik setzen. Die Studierenden k?nnen dabei externe Literaturquellen und deren genetischen Analysen in den Kontext des eigenen Berufsfeld setzen und aus verschiedenen, wissenschaftlichen Quellen erste informierte Vorentscheidungen für die eigenen Analysen treffen.

Wissenschaftliche Innovation

Die Studierende k?nnen genetische Ma?zahlen aus wissenschaftlichen Publikationen in andere wissenschaftliche Kontexte einordnen. Die Studierenden kennen die Grundlagen des wissenschaftlichen Arbeitens anhand von Fallbeispielen in der Genetik. Die Studierenden k?nnen genetische Visualisierungen aus Ver?ffentlichungen verstehen und erste informierte Forschungsideen entwickeln. Die Studierenden sind in der Lage bei der Erstellung von Daten aus Experimenten die Verwertbarkeit in R zu berücksichtigen.

Kommunikation und Kooperation

Die Studierenden sind in der Lage genetische Daten und Analysen mit anderen Forschenden zu teilen. Sie k?nnen die einzelnen Schritte der Analyse erkl?ren und die Ergebnisse allgemein verst?ndlich erkl?ren. Ebenfalls sind die Studierenden in der Lage g?ngige genetische Ma?zahlen zu erkennen und zu berichten. Die Studierenden k?nnen R Code lesen, erstellen und demonstrieren.

Wissenschaftliches Selbstverst?ndnis / Professionalit?t

Die Studierenden k?nnen wissenschaftliche Publikationen und deren genetischen Ma?zahlen sowie Ergebnisse in den Kontext des eigenen Berufsfeldes setzen und somit informierte Entscheidungen treffen. Diese informierten Entscheiden betreffen sowohl die praktische Anwendung wie auch die Bewertung von Forschungsideen in der wissenschaftlichen Grundlagenforschung. Die Studierende sind sich der inh?renten Unsicherheit der wissenschaftlichen, genetischen Forschung bewusst und k?nnen die eigenen Forschungsergebnisse diesbezüglich kritisch hinterfragen.

Literatur

  • Das Skript des Statistik- und Programmierteil des Moduls unter jkruppa.github.io/ 
  • Das Skript zum Bioinformatikteil unter https://jkruppa.github.io/bioinformatic/
  • Dormann, Carsten F. Parametrische Statistik. Springer Berlin Heidelberg, 2013.
  • Wickham, Hadley, and Garrett Grolemund. R for data science: import, tidy, transform, visualize, and model data. O'Reilly Media, Inc., 2016. r4ds.had.co.nz

Verwendbarkeit nach Studieng?ngen

  • Bioverfahrenstechnik in der Lebensmittelindustrie
    • Bioverfahrenstechnik in der Lebensmittelindustrie B.Sc. (01.09.2025)

  • ?kotrophologie
    • ?kotrophologie B.Sc. (01.09.2025)

    Modulpromotor*in
    • Kruppa-Scheetz, Jochen
    Lehrende
    • Kruppa-Scheetz, Jochen