Zum Inhalt

Nextflow für Genomikcourse

  • Kursübersicht


    Ein praxisorientierter Kurs, der Nextflow auf einen realen Genomik-Anwendungsfall anwendet: Variant Calling mit GATK.

    Dieser Kurs baut auf dem Hello Nextflow Einsteiger-Training auf und zeigt, wie du Nextflow im spezifischen Kontext der Genomik-Domäne nutzen kannst. Du wirst eine Variant-Calling-Pipeline mit GATK (Genome Analysis Toolkit) implementieren, einem weit verbreiteten Softwarepaket zur Analyse von High-Throughput-Sequenzierungsdaten.

  • Zusätzliche Informationen


    Technische Voraussetzungen

    Du benötigst ein GitHub-Konto ODER eine lokale Installation von Nextflow. Weitere Details findest du unter Umgebungsoptionen.

    Lernziele
    • Einen linearen Workflow zu schreiben, um Variant Calling auf eine einzelne Probe anzuwenden
    • Zusatzdateien wie Index-Dateien und Referenzgenom-Ressourcen angemessen zu handhaben
    • Das Dataflow-Paradigm von Nextflow zu nutzen, um Variant Calling pro Probe zu parallelisieren
    • Multi-Sample Joint Calling mit relevanten Channel-Operatoren zu implementieren
    Zielgruppe & Voraussetzungen
    • Zielgruppe: Dieser Kurs richtet sich an Forschende im Bereich Genomik und verwandten Feldern, die Datenanalyse-Pipelines entwickeln oder anpassen möchten.
    • Kenntnisse: Grundlegende Vertrautheit mit der Kommandozeile, grundlegenden Scripting-Konzepten und gängigen Dateiformaten der Genomik wird vorausgesetzt.
    • Voraussetzungen: Grundlegende Nextflow-Konzepte und -Werkzeuge, die im Kurs Hello Nextflow behandelt werden.

Kursübersicht

Dieser Kurs ist praxisorientiert, mit zielgerichteten Übungen, die darauf ausgelegt sind, Informationen schrittweise einzuführen.

Du beginnst damit, die Variant-Calling-Tools manuell im Terminal auszuführen, um die Methodik zu verstehen, und baust dann schrittweise eine Nextflow-Pipeline auf, die die Analyse automatisiert und skaliert.

Lektionsplan

Wir haben dies in drei Teile unterteilt, die sich jeweils auf spezifische Aspekte der Anwendung von Nextflow auf einen Genomik-Anwendungsfall konzentrieren.

Kurskapitel Zusammenfassung Geschätzte Dauer
Teil 1: Methodenübersicht Verständnis der Variant-Calling-Methodik und manuelle Ausführung der Tools 30 Min.
Teil 2: Variant Calling pro Probe Aufbau einer Pipeline, die BAM-Dateien indexiert und Varianten aufruft, dann Skalierung auf mehrere Proben 60 Min.
Teil 3: Joint Calling auf einer Kohorte Hinzufügen von Multi-Sample Joint Genotyping mit Channel-Operatoren zur Aggregation von Ausgaben pro Probe 45 Min.

Am Ende dieses Kurses kannst du grundlegende Nextflow-Konzepte und -Werkzeuge auf einen typischen Genomik-Anwendungsfall anwenden.

Bereit, den Kurs zu starten?

Los geht's