Pitanje:
Koriste li se meko izrezane baze za pozivanje varijanti u samtools + bcftools?
mattm
2017-05-19 23:50:05 UTC
view on stackexchange narkive permalink

Ako u nizu CIGAR postoje meko isječeni osnovni parovi za čitanje u SAM / BAM datoteci, hoće li se oni koristiti za pozivanje varijanti u samtools + bcftools tijek rada?

GATK HaplotypeCaller, na primjer, ima izričitu opciju --dontUseSoftClippedBases da li treba koristiti meko isječene baze. Dokumentacija o samtools ne spominje isječene baze.

Jedan odgovor:
#1
+12
Devon Ryan
2017-05-20 00:19:13 UTC
view on stackexchange narkive permalink

Ne, samtools (a samim tim i bcftools) ne koristi osnove s mekom izrezom. To možete brzo potvrditi pomoću dubine samtools ili samtools mpileup da biste pogledali regiju s poravnanjem s mekim isječcima. Primijetit ćete da se regija s mekanim isječcima ne koristi u dubini / skupljanju (oba alata koriste isti temeljni kôd, pa nije važno koji ćete koristiti). Ako ste znatiželjni, samtools zanemaruje meko izrezane baze jer se temelji na izradi poravnanja po osnovi za pokrivanje svakog položaja. U BAM formatu poravnanja se sortiraju i dodjeljuju kantama prema njihovom početnom / završnom položaju, što neće uključivati ​​meko izrezivanje. Slijedom toga, kada samtools pravi gomilu, neće ni vidjeti poravnanja koja bi se preklapala s datom bazom da su uključene meko izrezane baze.

To tada nekako postavlja pitanje što GATK-ov HaplotypeCaller radi različito. Tamo su regije u genomu u osnovi sastavljene u malom de Bruijn grafu, koji omogućava razrješavanje meko izrezanih baza oko indela, s obzirom na to da bi graf počinjao / završavao malo prije svake strane indela. To je također razlog zašto ne trebate napraviti novo poravnanje s HaplotypeCaller (to je bilo potrebno u starom UnifiedGenotyper).

Uredi : Za više detalja o HaplotypeCaller pogledajte ova lijepa stranica na web stranici GATK-a, koja ulazi u puno više detalja nego što sam ja to učinio ovdje.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...