Pitanje:
Kako usporediti grupe pomoću WGS podataka?
Jessica
2017-06-05 23:06:35 UTC
view on stackexchange narkive permalink

Imamo podatke o sekvenciranju cijelog genoma za pacijente (koji nisu karcinom) (n = 60) i za zdrave kontrole (n = 20). Centar za sekvenciranje pružio nam je najbolje prakse bioinformatičke analize, uključujući mapiranje čitanja (.BAM) i pozivanje varijanti pomoću GATK (.vcf), kao i bilješke (označene .vcf i .gVCF).

Koji bi trebali biti naši sljedeći koraci? Zanima nas postoje li razlike (globalne i / ili specifične) između skupina.

Je li to stvarno ono što vas zanima ili biste radije pronašli vjerojatne uzročne razlike?
Pozdrav Jessica, hvala što si napisala pitanje za Bioinformatics Stack Exchange. Vaše se pitanje dobro uklapa u format koji nam se sviđa na ovoj stranici, jer je specifičan za određeni zadatak i iza sebe sadrži dio priče. Ako želite poboljšati kvalitetu odgovora na ovo pitanje, moj bi prijedlog bio dodati informacije o vrstama analiza koje su vam već poznate ili vam je ugodno. Jeste li već koristili GATK ili R? Je li ovo dijagnostička postavka u kojoj je važna strukturirana, dokumentirana i ponovljiva analiza?
Zvuči kao da biste željeli raditi [GWAS] (https://en.wikipedia.org/wiki/Genome-wide_association_study), ali za to bi vam vjerojatno trebalo puno više uzoraka. Možete li postaviti svoje varijante na testiranje samo relevantnih regija genoma? To bi vam pomoglo da dobijete statističku snagu (manje testova -> bolje).
Dva odgovori:
gringer
2017-06-06 02:16:01 UTC
view on stackexchange narkive permalink

Nisam upoznat s programom, ali očito se Hail postavlja kao projekt motorne pile švicarske vojske za izvođenje nizvodne analize na varijantom nazvanim skupovima podataka.

Pregled Tuče možete pronaći ovdje:

http://blog.cloudera.com/blog/2017/05/hail-scalable-genomics-analysis-with-spark/

Vodič o testiranju pridruživanja možete pronaći ovdje:

https://hail.is/hail/tutorial.html#Association-testing

morgantaschuk
2017-06-06 20:26:24 UTC
view on stackexchange narkive permalink

Ako imate gVCF-ove, prvo što biste trebali isprobati je zajedničko pozivanje varijante. Prema GATK-u, zajednička varijanta koja naziva "omogućuje otkrivanje varijanti pružajući mogućnost iskorištavanja podataka iz cijele populacije iz kohorte višestrukih uzoraka [sic], što nam omogućuje otkrivanje varijanti s velikom osjetljivošću i uzoraka genotipa što je točnije moguće." izvor.

Jednom kada dobijete dva seta visokokvalitetnih varijanti, što ćete sljedeće učiniti ovisi o vašem istraživačkom pitanju. Tražite li mutacije koje se mogu drogirati? Temeljni uzroci? Biomarkeri? Prognoza pacijenta? Možete pogledati najčešće mutirane položaje u kohorti pacijenta i usporediti ih s vašom referentnom kohortom, provjeriti postoje li mutacije koje se istovremeno javljaju, grupirati ih, napraviti analizu glavnih komponenata, izvršiti neko strojno učenje kako bi ih raslojili itd.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...