Pitanje:
varijanta koja poziva podatke ChIP-seq stila: samtools mpileup s minimalnim filtrima
719016
2017-05-26 18:23:01 UTC
view on stackexchange narkive permalink

Izvodim samtools mpileup (v1.4) na bam datoteci s vrlo isprekidanim pokrivanjem (podaci u stilu ChIP-seq). Želim dobiti popis pozicija prvog prolaska sa SNV-ovima i njihovom učestalošću kako ih izvještava brojanje očitavanja, ali bez obzira na to što radim, neprestano filtriram sve SNV-ove kao da ne prolaze QC.

Što je magični parametar postavljen za početni popis SNV-ova i frekvencija?

UREDITI: ovo je pitanje koje sam objavio na "drugom" web mjestu, ali tamo nisam dobio odgovor.

Biste li mogli pokušati s drugim pozivateljem samo da biste provjerili? Nešto poput [varscan] (http://dkoboldt.github.io/varscan/)?
@nuin Mogu isprobati, dopušta li varscan isključivanje filtriranja?
Možete li dodati neke primjere naredbi koje ste isprobali?
@719016 Isprobajte ovu [naredbu] (http://dkoboldt.github.io/varscan/using-varscan.html#v2.‌ 3_pileup2snp) i promijenite opcije poput _-- min-pokrivenost _, _-- min-read2_ i _-- min-avg-qual_. Ovo će vam također pomoći da provjerite je li vaš problem povezan sa samtoolsom ili BAM datotekom
Samo sam pomalo zabrinut da ako dubina nije velika, a podaci ChIP-Seq imaju pristranosti, to nisu SNP-ovi s visokim povjerenjem. Cijela poanta HC SNP-a su i dubina očitavanja, što nije toliko u tradicionalnim ChIP-Seq
Da, možda bi pozivanje trebalo ograničiti na vršne vrhove, a zatim usporediti uzorak s uzorkom na podskupini takvih SNV-ova
Dva odgovori:
#1
+7
burger
2017-05-27 06:16:16 UTC
view on stackexchange narkive permalink

Ovo sam u prošlosti koristio za podatke ChIP-seq i generirao je SNV-ove:

  samtools mpileup \ - nekomprimirano --max-dubina 10000 --min-MQ 20 --ignore -RG --skip-indels \ - fasta-ref ref.fa file.bam \ | bcftools poziva --consensus-caller \ > out.vcf  

Ovo je bio samtools 1.3 u slučaju da to čini razliku.

Dobio sam da radi s ovim parametrima. Hvala!
#2
+5
user172818
2017-05-29 19:47:27 UTC
view on stackexchange narkive permalink

Drugi je pristup htsbox. Popis kandidata možete dobiti pomoću:

  htsbox pileup -Cvcf ref.fa -q20 -Q20 -s5 file.bam > out.vcf  

Ovdje , -q postavlja minimalnu kvalitetu mapiranja, -Q postavlja minimalnu osnovnu kvalitetu, -v daje samo varijante -c izlazi VCF, -C daje vam osnovno računanje na oba lanca i konačno -s5 zahtijeva najmanje 5 visokokvalitetnih baza za pozivanje alela. Korisno je kad vaši podaci ne uspijevaju pretpostaviti tipične varijantne pozivatelje.

Zašto ne bi samtools + bcftools ili varscan? Transparentnost i brzina. Ovaj naredbeni redak jednostavno se računa na temelju parametara koje koristite. Ne primjenjuje dodatne operacije. I zbog toga je to za reda veličine brže nego samtools mpileup ili varscan. Vrijedno je napomenuti da samtools prema zadanim postavkama koristi BAQ, koji povremeno smanjuje FP. Međutim, BAQ nije baš potreban za dulje čitanje Illumine, a istovremeno šteti osjetljivosti.

Svakako ću isprobati htsbox, jer kažete da to radi jednostavnim brojanjem na osnovu parametara.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...