Nextflow für Genomikcourse¶
-
Kursübersicht
Ein praxisorientierter Kurs, der Nextflow auf einen realen Genomik-Anwendungsfall anwendet: Variant Calling mit GATK.
Dieser Kurs baut auf dem Hello Nextflow Einsteiger-Training auf und zeigt, wie du Nextflow im spezifischen Kontext der Genomik-Domäne nutzen kannst. Du wirst eine Variant-Calling-Pipeline mit GATK (Genome Analysis Toolkit) implementieren, einem weit verbreiteten Softwarepaket zur Analyse von High-Throughput-Sequenzierungsdaten.
-
Zusätzliche Informationen
Technische Voraussetzungen
Du benötigst ein GitHub-Konto ODER eine lokale Installation von Nextflow. Weitere Details findest du unter Umgebungsoptionen.
Lernziele
- Einen linearen Workflow zu schreiben, um Variant Calling auf eine einzelne Probe anzuwenden
- Zusatzdateien wie Index-Dateien und Referenzgenom-Ressourcen angemessen zu handhaben
- Das Dataflow-Paradigm von Nextflow zu nutzen, um Variant Calling pro Probe zu parallelisieren
- Multi-Sample Joint Calling mit relevanten Channel-Operatoren zu implementieren
Zielgruppe & Voraussetzungen
- Zielgruppe: Dieser Kurs richtet sich an Forschende im Bereich Genomik und verwandten Feldern, die Datenanalyse-Pipelines entwickeln oder anpassen möchten.
- Kenntnisse: Grundlegende Vertrautheit mit der Kommandozeile, grundlegenden Scripting-Konzepten und gängigen Dateiformaten der Genomik wird vorausgesetzt.
- Voraussetzungen: Grundlegende Nextflow-Konzepte und -Werkzeuge, die im Kurs Hello Nextflow behandelt werden.
Kursübersicht¶
Dieser Kurs ist praxisorientiert, mit zielgerichteten Übungen, die darauf ausgelegt sind, Informationen schrittweise einzuführen.
Du beginnst damit, die Variant-Calling-Tools manuell im Terminal auszuführen, um die Methodik zu verstehen, und baust dann schrittweise eine Nextflow-Pipeline auf, die die Analyse automatisiert und skaliert.
Lektionsplan¶
Wir haben dies in drei Teile unterteilt, die sich jeweils auf spezifische Aspekte der Anwendung von Nextflow auf einen Genomik-Anwendungsfall konzentrieren.
| Kurskapitel | Zusammenfassung | Geschätzte Dauer |
|---|---|---|
| Teil 1: Methodenübersicht | Verständnis der Variant-Calling-Methodik und manuelle Ausführung der Tools | 30 Min. |
| Teil 2: Variant Calling pro Probe | Aufbau einer Pipeline, die BAM-Dateien indexiert und Varianten aufruft, dann Skalierung auf mehrere Proben | 60 Min. |
| Teil 3: Joint Calling auf einer Kohorte | Hinzufügen von Multi-Sample Joint Genotyping mit Channel-Operatoren zur Aggregation von Ausgaben pro Probe | 45 Min. |
Am Ende dieses Kurses kannst du grundlegende Nextflow-Konzepte und -Werkzeuge auf einen typischen Genomik-Anwendungsfall anwenden.
Bereit, den Kurs zu starten?