Pitanje:
Kako se nositi s heterozigotnošću tijekom poliranja sklopa genoma na temelju dugih čitanja?
Kamil S Jaron
2017-05-21 16:49:59 UTC
view on stackexchange narkive permalink

Sve dugo čitane platforme za sekvenciranje temelje se na sekvenciranju od jedne molekule što uzrokuje veće stope pogrešaka po bazi. Iz tog je razloga cjevovodima za sastavljanje genoma dodan korak poliranja - mapiranje sirovih očitavanja natrag u sklop i ispravljanje detalja sklopa.

Imam pristojan PacBio RSII skup podataka o pojedinačnom genomu jako heterozigotnih nemodnih vrsta . Sastav je prošao dobro, ali kad sam pokušao polirati sklop pomoću tobolaca, nije se mogao konvergirati u nekoliko iteracija i kladim se da je to zbog prevelike divergencije haplotipova.

Postoji li neki drugi način za poliranje genoma s takvim svojstvima? Na primjer, postoji li način za odvajanje dugih čitanja po haplotipu, tako da bih mogao polirati samo jednim haplotipom?

Dva odgovori:
#1
+4
roblanf
2017-05-22 08:36:12 UTC
view on stackexchange narkive permalink

Nekoliko mogućnosti:

Sokol

Pokušajte raskopčati sokol i sokol. Oni su dizajnirani točno za vaš problem i vaše podatke: https://github.com/PacificBiosciences/FALCON

Nije Falcon

Ako mislite da ste sklopili haplotipove (što se čini razumnim očekivati ​​s obzirom na dovoljno pokrivenosti), trebali biste moći vidjeti dva haplotipa samo radeći sva poravnavanja svojih kontigova. Haplotipovi bi se trebali prikazati kao parovi kontigova koji su PUNO sličniji (čak i s puno razilaženja između haplotipova) od ostalih parova. Jednom kada imate sve takve parove, jednostavno možete odabrati jedan od svakog para za poliranje.

Doista imam obje haplotipske sekvence. Dobio sam ih pomoću alata nazvanog [haplomerger2] (http://www.ncbi.nlm.nih.gov/pubmed/22555592). Ali ovaj alat stvara himerni haploidni sklop, stoga oni zapravo nisu pravilno fazirani haplotipovi. Falcon-unzip je zaista softver koji može raditi. U to je vrijeme bilo premlado za pokušaj, ali sada bih mogao pokušati još jednom.
#2
+3
gringer
2017-05-22 13:12:38 UTC
view on stackexchange narkive permalink

Možete i otići na Canu. Dizajniran je za dugo čitani sklop (i PacBio i Nanopore), iako nije posebno za složeno sekvenciranje populacije. Pokušava ukloniti genom u njegove jedinstvene komponente i generira putanje od onih komponenata koje su dobro podržane u očitanjima.

Što se tiče poliranja, čini se da slučaj jest da poliranje ne konvergiraju, i bit će puno varijanti koje samo osciliraju između dvije mogućnosti. Za mene i barem još jednu osobu u London Callingu ove godine, u osnovi nismo dobili dobitak u preciznosti poliranja nakon treće iteracije. Koristio sam vlastiti algoritam za ispravljanje pogrešaka, ali oni su koristili "standardnije" poliranje s Pilonom. Koliko vrijedi, nanopore WGS konzorcij koristio je Racon za poliranje njihovih Canu sklopova.

Zapravo sam sastavio genom koristeći Canu, dobio sam ~ 2x haploidnu veličinu genoma, koji sam se srušio na haplotipove pomoću [HaploMerger2] (http://www.ncbi.nlm.nih.gov/pubmed/22555592). znajte da je globalno skupština dobra. Samo ga treba polirati.
O da. Oprostite, pogledao sam prvi odgovor i pretpostavio da se ovdje radi samo o montaži. Sad shvaćam da se pitanje raspravljalo o * poliranju *, a ne o montaži.
@gringer Također sam pokušavao polirati sklop heterozigotnog genoma (generirao ga je canu), koristeći Racon (Quiver bi srušio haplotipove), ali nisam mogao dobiti zadovoljavajući rezultat (u osnovi, nijedna statistika se nije promijenila). Neki savjet?
Moja općenita preporuka u ovom trenutku bila bi da se za ispravljanje koristi nanopoli u načinu metilacije, tada Pilon s Iluminom čita * samo * ispravljanje fragmenata homopolimera (tj. Bez korekcije SNP-a i bez skeleta dugog dometa). Na temelju ovoga: https: //github.com/rrwick/Basecalling-comparison#methylation


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...