Pitanje:
Kada uzeti u obzir genomske regije s crne liste u analizama podataka ChIP-seq?
olga
2017-06-05 22:15:40 UTC
view on stackexchange narkive permalink

U grupi smo čuli da je važno pratiti i filtrirati regije artefakata prilikom analize podataka iz eksperimenta funkcionalne genomike, posebno ChIP-seq.

Ovdje smo vidjeli cjevovode koji uklanjaju trase ENCODE i) prije QC-ova za unakrsnu korelaciju, ii) nakon QC-a za unakrsnu korelaciju, ali prije vršnog poziva i iii) nakon vršnog poziva.

Primijetili smo da uklanjanje tragova ne utječe značajno na međusobnu korelaciju i vrhovno neovisne QC. Međutim, nismo sigurni treba li vršiti pozive na filtriranim stazama ili ne?

Jedan odgovor:
Devon Ryan
2017-06-05 22:41:43 UTC
view on stackexchange narkive permalink

Na stranu: unakrsna korelacija uglavnom je besmislena, bez obzira na to što bi neki od ENCODE mogli tvrditi. Kada obrađujemo naše DEEP uzorke, mi ni ne gledamo tu vrijednost.

Bez obzira na to, ako za uzajamnu korelaciju koristite SPP / phantomPeakQual, imajte na umu da on već uklanja najviše vrhove iz vašeg skupa podataka prije izračunavanje međusobne korelacije (zapravo, može ukloniti i većinu stvarnih vrhova, što čini da se čovjek dalje pita što vam zapravo govori). Ne znam da je ovo zapravo bilo gdje dokumentirano, primijetio sam to dok sam prolazio kroz kôd dok sam razmišljao da li da ga implementiram u deepTools. Ali barem već ignorira ove regije :)

Općenito, najprikladnije je samo ukloniti vrhove koji se preklapaju s područja s crne liste. U idealnom svijetu filtrirali biste očitanja s crne liste prije vršnog pozivanja, ali (1) to je stvarno nezgodno (potrebno je više vremena i diska) i (2) Nikad nisam vidio značajan dobitak u vrhunskim performansama poziva. U teoriji biste barem trebali gubiti osjetljivost oko regija s crne liste ako ne uklonite čitajuća područja koja se preklapaju s crne liste, ali morate se zapitati želite li ipak vjerovati takvim vrhovima. Za ostale korake QC-a, barem uz deepTools, uz svaki alat pružamo parametar koji određuje BED datoteku regija s crne liste koje treba preskočiti.

Osim toga, mnogo je manje regija s crne liste u novijim gradnjama genoma ( GRCh38 i GRCm38), tako da je ovo općenito manje problem s njima.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...