Nextflow dla Genomikicourse¶
-
Podsumowanie kursu
Praktyczny kurs stosowania Nextflow do rzeczywistego przypadku użycia w genomice: wykrywania wariantów za pomocą GATK.
Ten kurs opiera się na Hello Nextflow – szkoleniu dla początkujących i demonstruje, jak używać Nextflow w specyficznym kontekście dziedziny genomiki. Zaimplementujesz pipeline wykrywania wariantów z GATK (Genome Analysis Toolkit), szeroko stosowanym pakietem oprogramowania do analizy danych z sekwencjonowania wysokoprzepustowego.
-
Dodatkowe informacje
Wymagania techniczne
Będziesz potrzebować konta GitHub LUB lokalnej instalacji Nextflow'a. Szczegóły znajdziesz w Opcjach środowiska.
Cele szkoleniowe
- Napisać liniowy workflow do wykrywania wariantów dla pojedynczej próbki
- Odpowiednio obsługiwać pliki pomocnicze, takie jak pliki indeksów i zasoby genomu referencyjnego
- Wykorzystać paradygmat przepływu danych Nextflow do zrównoleglenia wykrywania wariantów dla poszczególnych próbek
- Zaimplementować wielopróbkowe wspólne genotypowanie, używając odpowiednich operatorów kanałów
Odbiorcy i wymagania wstępne
- Odbiorcy: Ten kurs jest przeznaczony dla badaczy w dziedzinie genomiki i pokrewnych obszarach, którzy chcą tworzyć lub dostosowywać pipeline'y analizy danych.
- Umiejętności: Zakładamy pewną znajomość wiersza poleceń, podstawowych koncepcji skryptowania oraz popularnych formatów plików genomicznych.
- Wymagania wstępne: Podstawowe koncepcje i narzędzia Nextflow omówione w Hello Nextflow.
Przegląd kursu¶
Kurs ma charakter praktyczny, z ćwiczeniami ukierunkowanymi na cel, zorganizowanymi tak, aby stopniowo wprowadzać nowe informacje.
Zaczniesz od ręcznego uruchamiania narzędzi do wykrywania wariantów w terminalu, aby zrozumieć metodologię, a następnie krok po kroku zbudujesz pipeline Nextflow automatyzujący i skalujący analizę.
Plan lekcji¶
Podzieliliśmy kurs na trzy części, z których każda koncentruje się na konkretnych aspektach stosowania Nextflow do przypadku użycia w genomice.
| Rozdział kursu | Podsumowanie | Szacowany czas trwania |
|---|---|---|
| Część 1: Przegląd metody | Zrozumienie metodologii wykrywania wariantów i ręczne uruchamianie narzędzi | 30 min |
| Część 2: Wykrywanie wariantów dla pojedynczych próbek | Budowa pipeline'u indeksującego pliki BAM i wykrywającego warianty, a następnie jego skalowanie na wiele próbek | 60 min |
| Część 3: Wspólne genotypowanie kohort | Dodanie wielopróbkowego wspólnego genotypowania przy użyciu operatorów kanałów do agregacji wyników | 45 min |
Pod koniec tego kursu będziesz w stanie zastosować podstawowe koncepcje i narzędzia Nextflow do typowego przypadku użycia w genomice.
Gotowy, aby rozpocząć kurs?