Pitanje:
Koja su de facto obavezna polja u SAM / BAM grupi za čitanje?
mattm
2017-06-09 20:51:25 UTC
view on stackexchange narkive permalink

SAM specifikacija označava da svaka čitana grupa mora imati jedinstveno polje ID, ali ne označava nijedno drugo polje kao potrebno.

Također sam otkrio da htsjdk baca iznimke ako je polje uzorka (SM) prazno, iako u specifikaciji nema naznaka da je to potrebno.

Postoje li druga polja čitane grupe za koja bih trebao očekivati ​​da će ih zahtijevati uobičajeni alati?

Dva odgovori:
user172818
2017-06-09 21:28:09 UTC
view on stackexchange narkive permalink

Uzorak oznake (tj. SM) bila je obavezna oznaka u početnoj specifikaciji SAM-a (pogledajte datoteku .pages ; potreban vam je Mac da biste je otvorili). Prilikom prelaska na Latex taj je zahtjev misteriozno odustao. Picard odgovara početnim specifikacijama. U svakom slučaju, uzorak oznake važan je za dosta alata. Preporučujem vam da ga dodate.

Misterij je objašnjen u [tadašnjoj poruci samtools-devel] (https://sourceforge.net/p/samtools/mailman/message/25788014/): _ Ponekad jednostavno želimo grupirati čitanja bez uzoraka informacija_. Također pogledajte [hts-specs issue # 286] (https://github.com/samtools/hts-specs/issues/286).
gringer
2017-06-09 21:01:18 UTC
view on stackexchange narkive permalink

Identifikator čitane grupe mora biti naveden i u zaglavlju reda BAM / SAM datoteke i u liniji poravnanja. Nisu potrebna nikakva druga polja, ali imajte na umu da, jer se dodatne informacije pohranjuju samo jednom (tj. U zaglavlju), neće dodati puno veličinama datoteka ili vremenu obrade ako su uključena dodatna polja. Ako bilo koje drugo neobvezno polje uzrokuje probleme (bilo uključivanjem ili isključivanjem), bilo bi korisno prijaviti problem o tome.

Stariji alati zahtijevali su da navedete oba ID grupe za čitanje zaglavlja i ID grupe za čitanje poravnanja, ali čini se da je većina alata nedavnih alata koje sam koristio dovoljno inteligentna da će dodati zaglavlja za sve grupe za čitanje bez tih podataka.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...