Pitanje:
Rad sa starim genomima
zx8754
2017-06-01 01:47:18 UTC
view on stackexchange narkive permalink

Je li i dalje valjan rad sa starim građevinama i oslanjanje na njih?

Na primjer, NCBI36 / hg18. Da li bi rezultati radova na temelju starih izrada zahtijevali LiftOver i ponovnu analizu kako bi bili korisni?

Malo konteksta, ovo je povezano s drugim postom, gdje imamo rezultate utemeljene na ACGH o staroj verziji: Kako mogu provjeriti valjanost jednog uzorka rezultata ArrayCGH?

To će vjerojatno ovisiti o vrsti analize koju imate na umu. Na kraju, svi podaci koje danas generiramo bit će jednog dana zastarjeli, ali to ne mora značiti da su svi zaključci pogrešni. Ako biste bili precizniji o vrstama analiza koje imate na umu (ili konkretnim radovima pomoću hg18), možda bi bilo lakše dati točan odgovor.
četiri odgovori:
#1
+8
Karel Brinda
2017-06-01 02:03:51 UTC
view on stackexchange narkive permalink

Po mom mišljenju, to nije baš pouzdano. LiftOver je vrlo ograničen u smislu transformacija koje može podržati. LiftOver Chain format može hvatati samo podudarne regije istim redoslijedom. To znači da može računati na indele, ali čak i jednostavne strukturne varijacije postaju problematične.

Na primjer, kada je dostupan noviji sklop, obično je preporučena praksa da se sva očitavanja remapiraju umjesto da se transformiraju postojeći poravnanja.

#2
+4
Manuel
2017-06-01 04:34:31 UTC
view on stackexchange narkive permalink

Mislim da su trenutno jedine ljudske gradnje koje vrijedi razmotriti hg19 / GRCh37 jer mnoge baze podataka poput gnomAD još uvijek koriste isključivo ovo izdanje. S druge strane, hg38 / GRCh8 ima mnoštvo važnih ispravki i korisnu (ali ipak nedovoljno iskorištenu) značajku alternativnih lokusa.

Sve iz starijih izdanja trebalo bi preimenovati u novije.

#3
+2
story
2017-06-08 11:38:40 UTC
view on stackexchange narkive permalink

Možete koristiti liftOver koji nije uvijek sjajan.

Kad god se susretnem s tim (posebno NGS podaci koji su lako dostupni na SRA-u), često samo dobijem neobrađene datoteke (npr. fastqs) i ponovno align / re-map.

U vašem slučaju (nizovi) to može biti malo teško. Ipak, nije nemoguće, jer sam nedavno uzeo neke podatke o starom DNA / RNA mikrotalasu kvasca i ažurirao ih na najnoviji genom. Potrebni su samo pravi podaci (poput DNK za normalizaciju) i dobro razumijevanje cijelog procesa.

Posljednje utočište / alternativa je usklađivanje vaših novih podataka sa starim genomom kako bi biti u mogućnosti napraviti usporedbe. Ovo nije idealno, ali djeluje u slučajevima kada nadogradnja jednog izvora nije moguća ili je OGROMNA količina vremena / truda. Učinio sam to za nekoliko eksperimenata s letenjem gdje su svi dostupni / prethodni podaci rađeni u dm3. Svi stari genomi mogu se općenito naći na http://archive.ensembl.org.

#4
  0
burger
2017-06-08 05:09:09 UTC
view on stackexchange narkive permalink

Za miševe još uvijek vidim ljude koji koriste mm9 / NCBI37 u izdanjima visokog profila, iako je mm10 / GRCm38 objavljen prije više od 5 godina (2011). Osobno mislim da to nije sjajna ideja, ali svakako vrijedi prema recenzentima.

Ovisi i o vašoj prijavi. Ako radite s regijama kodiranja (vjerojatno već dugo poznatima) ili izvlačite statistiku za čitav genom (obogaćivanje na TSS-u, na primjer), razlike bi trebale biti zanemarive.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...