Pitanje:
Upisivanje nedostajućih genotipova iz zasebnih genotipskih ploča
Greg
2017-06-01 12:27:26 UTC
view on stackexchange narkive permalink

Koji je trenutni standard za unošenje nedostajućih genotipova između dvije ploče za genotipizaciju? Imam dvije populacije genotipizirane pomoću dvije različite ploče (A & B) i želio bih imputirati sve genotipove u populaciji B za one položaje koji se koriste u ploči A.

Pročitao sam primjere za impute2 i mislim da je najbliža onome što tražim ovaj primjer, "Imputacija s jednom nefaziranom referentnom pločom".

Jednostavno rečeno, želim pružiti popis SNP-ova, neku datoteku varijante za populaciju B i podatke o haplotipu od 1.000 genoma i dobiti imputirane genotipove za svaki SNP na popisu. Je li impute2 stanje tehnike za to?

Ovisi da li imputiramo cijeli genom, svi su kromosomi prilično čvrsti. Nefazirana ploča dala bi bolji rezultat, ali spore performanse. Ako imputiramo regiju, mislim da je beagle bolji.
Ne želim imputirati cijeli genom, samo određene određene web lokacije.
Jedan odgovor:
#1
+4
winni2k
2017-06-01 20:22:21 UTC
view on stackexchange narkive permalink

S obzirom na to da spominjete želju za korištenjem 1000 genoma kao referentne ploče za imputiranje genotipova u vaše dvije SNP ploče panela, pretpostavit ću da radite s ljudskim podacima.

U tom slučaju postoji nekoliko opcija s kojima možete izaći:

  • Ako su vaša dva panela europskog podrijetla, onda je vjerojatno najbolje da koristite HRC referentna ploča zajedno s alatom za brzu imputaciju genotipa kao što je Beagle 4.1 za imputiranje genotipova u svaku od vaše dvije ploče SNP čipa zasebno.
  • Ako vaše ploče nisu od Europskog podrijetla, vjerojatno ćete htjeti upotrijebiti referentnu ploču faze 3 od 1000 genoma s Beagle 4.1, Impute2 ili Minimac3.

U oba slučaja dostupne su dvije usluge faze koje će raditi veći dio teškog dizanja za vas 1, 2.

Drugi članak Dobrodošli u Trust Case-Control Consortium izveo je analiza unakrsne imputacije kako opisujete. Ne vidim mnogo studija na višestrukim SNP pločama čipova. U svojoj analizi morat ćete voditi računa da vas ne pogađaju skupni efekti korištenja dvije različite SNP ploče panela.

Također, nijedna od ovih metoda neće raditi ako regija u koju unosite ima premalo varijante. Nisam siguran koliki je minimalni broj varijanti, ali ako upotrebljavate ploču za genotipizaciju cijelog genoma od najmanje 500 000 SNP-ova, onda biste trebali biti u redu ako odjednom imputirate čitav kromosom.

Hvala! Ovo se čine kao dobre mogućnosti. I da, radim s ljudskim podacima. Ne znam točno koje su nacionalnosti sudionici, a pretpostavljam da je vjerojatno riječ o raznolikoj populaciji, pa mi 1000 Genoma ima najviše smisla. Spominjete Beaglea nekoliko puta, postoji li neki razlog zbog kojeg ga preferirate?
Nemam dovoljno iskustva s uspoređivanjem tri programa Beagle 4.1, Impute2 i Minimac3 da bih zaista izgovorio postavke. Trebali biste dobiti kvalitetnu imputaciju s bilo kojim od njih, ali testirajte sebe, što je lako učiniti imputiranjem održanih genotipova. Jedino je upozorenje ovo što mislim da će Impute2 vjerojatno trebati malo više vremena od ostalih programa prilikom imputiranja iz referentne ploče veličine HRC-a.
Beagle je izvrsno radio i bio je jednostavan za upotrebu. Toplo preporučujem


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...