Pitanje:
Učinci nepotpune konverzije bisulfita na učinkovitost mapiranja
DDRRpy
2017-05-24 11:41:10 UTC
view on stackexchange narkive permalink

Ovo je pitanje objavljeno i na Biostars

Sekvencirao sam brojne multipleksirane skupine biblioteka BS amplicon-seq izvedenih iz ljudskih uzoraka na MiSeq tijekom posljednjih nekoliko tjedana. Koristim trim-galore i Bismark za poravnavanje i nalazim da je učinkovitost mapiranja zaista niska za dva bazena (55% & 30%), a oba su imala citozin po baznoj sekvenci od oko 10-20% tijekom cijelog pročitajte u njihovim datotekama fastqc.

Visok sadržaj C vidljiv u datotekama fastqc čini me lošom učinkovitošću mapiranja zbog slabe pretvorbe bisulfita, jer bi se očekivalo da će to biti blizu nule jer je pretvorba bisulfita zapravo se dogodio.

Novi sam na terenu pa bi svaka pomoć bila vrlo zahvalna.

Možda bi bilo dobro upoznati se s koracima koji stoje iza mapiranja pretvorenih čitanja bisulfita. U ovom postu o [biostars] (https://www.biostars.org/p/107871/) dajem brzu raščlambu koraka ako želite pogledati (ali, naravno, postoji puno dostupnog materijala na tome).
Jedan odgovor:
#1
+7
Devon Ryan
2017-05-24 11:46:37 UTC
view on stackexchange narkive permalink

Učinkovitost pretvorbe bisulfita nema utjecaja na brzinu mapiranja u bismarku i sličnim alatima. Razlog je taj što su očitanja u potpunosti pretvorena u bisulfit in silico prije poravnavanja kako bi se smanjila pristranost mapiranja.

Predložio bih vam da se poigrate s postavkama koje su predane bowtie2, poput upotrebe lokalno poravnanje i izmjena opcije --score-min kako bi se omogućilo više nepodudaranja. Možete i pokušati s drugim poravnavačem poput bwameth, koji će uvijek izvršiti lokalno poravnanje.

Hvala vam. --lokalna zastava u bowtie2 dokumentima izgleda obećavajuće, pokušat ću ovo kad uđem u ured. Hoće li Bismark raščlaniti bilo koju opciju / zastavicu bowtie2 na bowtie2 (pitam kao --local nije prisutan u bisamark dokumentima već samo unutar bowtie2 dokumenata)? Što mogu zaključiti o visokom citozinu po osnovnoj sekvenci u datotekama fastqc? Općenito sam otkrio da je to 0% u prethodnim analizama ili 10% na krajevima, u kojem bih trenutku obrezao krajeve.
Ne mislim da će bismark pravilno rukovati zastavicom `--local`, jer očekuje da će se čitanja u potpunosti poravnati ili odbaciti, bez ikakvog mekog isjecanja.
Ako nakon pokretanja bismarka MBIAS crteži ne izgledaju relativno ravno, možete proslijediti parametar filtra bismark_methylation_extractor, tako da na pr. zanemarite zadnjih 10 bp svakog čitanja.
@719016: Možda ste u pravu, prošlo je nekoliko godina otkako sam pogledao bismark kôd, uglavnom ga pokušavam izbjegavati jer je tako nevjerojatno spor i nekada daje loše rezultate.
Kao što Devon Ryan također predlaže, možda biste željeli isprobati bwameth, koji je jednostavan omot oko bwa-mema, i zadržava meko izrezane poravnave ako postoje. Tada možete primijeniti drugu skriptu za brojanje CpG-ova od bama, na pr. ovaj: https://github.com/dariober/bioinformatics-cafe/tree/master/bam2methylation
Općenito preporučujem [MethylDackel] (https://github.com/dpryan79/MethylDackel) za ekstrakciju metilacije i QC, ali pristran sam: P


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...