Nextflow per la Genomicacourse¶
-
Riepilogo del corso
Un corso pratico che applica Nextflow a un caso d'uso reale della genomica: variant calling con GATK.
Questo corso si basa sulla formazione per principianti Hello Nextflow e dimostra come utilizzare Nextflow nel contesto specifico del dominio della genomica. Implementerete una pipeline di variant calling con GATK (Genome Analysis Toolkit), un pacchetto software ampiamente utilizzato per analizzare dati di sequenziamento ad alto rendimento.
-
Informazioni aggiuntive
Requisiti tecnici
Avrai bisogno di un account GitHub OPPURE di un'installazione locale di Nextflow. Consulta Opzioni ambiente per maggiori dettagli.
Obiettivi di apprendimento
- Scrivere un workflow lineare per applicare il variant calling a un singolo campione
- Gestire appropriatamente file accessori come file indice e risorse del genoma di riferimento
- Sfruttare il paradigma di dataflow di Nextflow per parallelizzare il variant calling per campione
- Implementare il joint calling multi-campione utilizzando operatori di canale rilevanti
Destinatari e prerequisiti
- Pubblico: Questo corso è progettato per ricercatori nel campo della genomica e settori correlati che desiderano sviluppare o personalizzare pipeline di analisi dei dati.
- Competenze: Si presume una certa familiarità con la riga di comando, concetti di scripting di base e formati di file comunemente utilizzati nella genomica.
- Prerequisiti: Concetti e strumenti fondamentali di Nextflow trattati in Hello Nextflow.
Panoramica del corso¶
Questo corso è pratico, con esercizi orientati agli obiettivi strutturati per introdurre le informazioni in modo graduale.
Inizierete eseguendo manualmente gli strumenti di variant calling nel terminale per comprendere la metodologia, quindi costruirete progressivamente una pipeline Nextflow che automatizza e scala l'analisi.
Piano delle lezioni¶
Abbiamo suddiviso questo corso in tre parti che si concentrano ciascuna su aspetti specifici dell'applicazione di Nextflow a un caso d'uso della genomica.
| Capitolo del corso | Sommario | Durata stimata |
|---|---|---|
| Parte 1: Panoramica del metodo | Comprensione della metodologia di variant calling ed esecuzione manuale degli strumenti | 30 minuti |
| Parte 2: Variant calling per campione | Costruzione di una pipeline che indicizza file BAM e chiama varianti, poi scala a più campioni | 60 minuti |
| Parte 3: Joint calling su una coorte | Aggiunta del joint genotyping multi-campione utilizzando operatori di canale per aggregare output per campione | 45 minuti |
Al termine di questo corso, sarete in grado di applicare concetti e strumenti fondamentali di Nextflow a un caso d'uso tipico della genomica.
Pronti a seguire il corso?