Pitanje:
Koja je razlika između samtools, bamtools, picard, sambamba i biobambam?
medbe
2017-06-03 04:50:11 UTC
view on stackexchange narkive permalink

Nakon nekoliko pretraživanja na Googleu, pronašao sam više alata s preklapajućom funkcionalnošću za pregled, spajanje, kopiranje itd. Nemam vremena za isprobavanje ovih alata, pa ću vidjeti da li netko već zna odgovor: u čemu je razlika ih? Izvođenje? Značajke? Ili nešto drugo? Koji je općenito poželjniji? Samtools?

Ovo će pitanje vjerojatno potaknuti raspravu o zaslugama (ili na neki drugi način) različitih alata, što se na StackExchangeu obeshrabruje. Bilo bi korisno kad bi se postavilo jedno pitanje, po mogućnosti ono koje se pokušava držati podalje od preferencija ljudi.
U "nešto drugo" možete dodati kvalitetu dokumentacije, što može biti važan čimbenik koji dolazi u obzir kada se odlučuje koji ćete alat usvojiti.
Jedan odgovor:
#1
+15
gringer
2017-06-03 06:50:55 UTC
view on stackexchange narkive permalink

Očiti je odgovor da su ih napisali različiti ljudi. U bioinformatici je prilično uobičajeno da ljudi s predznanjem informatike postanu frustrirani postojećim alatima i stvore svoj vlastiti alternativni alat (umjesto da poboljšaju postojeći alat). S vremenom će alati sa sličnim početnim ciljevima imati ugrađenu popularnu funkcionalnost (i na kraju ispraviti greške), tako da je manje važno koji se određeni alat koristi za uobičajene metode.

Evo mog dojma o alatima :

  1. samtools - izvorno napisao Heng Li (koji je također napisao BWA). Ljudi koji sada rade na samtoolsu također održavaju specifikaciju formata datoteke za poravnanje za SAM, BAM i CRAM, tako da će se vjerojatno sve nove značajke formata datoteke najprije implementirati u samtools.

  2. bamtools - čini se da su to napisali Derek Barnett, Erik Garrison, Gabor Marth, Michael Stromberg da bi zrcalili samtools alatni alat, ali koristeći C ++ umjesto C

  3. picard - Java alati koje je napisao Broad Institute za manipulaciju BAM / SAM datotekama. Pisanje na Javi olakšava prijenos na druge operativne sustave, tako da može bolje funkcionirati na Windows sustavima. Upoznatiji sam s picardom koji se koristi na razini filtriranja (npr. Uklanjanje PCR duplikata) i za statističku analizu, ali povezuje se s Java HTS knjižnicom iz samtools-a, tako da vjerojatno dijeli puno funkcija.

  4. sambamba - komplet alata s licencom GPL2 napisan u programskom jeziku D (vjerojatno Artem Tarasov i Pjotr ​​Prins). Nisam ga koristio (i ne znam ljude koji su ga koristili), ali github stranica sugerira "Gotovo 5 godina glavna prednost nad samtoolsima bilo je paralelizirano očitavanje BAM-a. Napokon je u ožujku 2017. izdan samtools 1.4, dostigavši ​​paritet o ovome. "

  5. biobambam - napisao njemački Tischler na jeziku C ++. Također nemam iskustva s ovim alatom. Čini se da ovo ima neke mogućnosti višestrukog uvođenja niti, ali je inače slično ostalim alatima.

Usporedba brzine sortiranja između SAMtools (verzija 1.2) i sambambe (verzija 0.6.3) [ovdje] (https://www.basepairtech.com/blog/sorting-bam-files-samtools-vs-sambamba/).
U svjetlu starijih verzija Samtools-a koji su sporiji od Sambambe, ponekad morate uzeti u obzir i potrebe cjelokupnog cjevovoda. Na primjer, neki stariji softver zahtijeva pokretanje starih verzija Samtools-a, što može otežati postizanje brzih prednosti od novijih Samtools-a i dovesti do odabira da u potpunosti koriste drugi program, umjesto da moraju podržavati različite verzije istog alata u vašem cjevovod.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...