Na stranu: unakrsna korelacija uglavnom je besmislena, bez obzira na to što bi neki od ENCODE mogli tvrditi. Kada obrađujemo naše DEEP uzorke, mi ni ne gledamo tu vrijednost.
Bez obzira na to, ako za uzajamnu korelaciju koristite SPP / phantomPeakQual, imajte na umu da on već uklanja najviše vrhove iz vašeg skupa podataka prije izračunavanje međusobne korelacije (zapravo, može ukloniti i većinu stvarnih vrhova, što čini da se čovjek dalje pita što vam zapravo govori). Ne znam da je ovo zapravo bilo gdje dokumentirano, primijetio sam to dok sam prolazio kroz kôd dok sam razmišljao da li da ga implementiram u deepTools. Ali barem već ignorira ove regije :)
Općenito, najprikladnije je samo ukloniti vrhove koji se preklapaju s područja s crne liste. U idealnom svijetu filtrirali biste očitanja s crne liste prije vršnog pozivanja, ali (1) to je stvarno nezgodno (potrebno je više vremena i diska) i (2) Nikad nisam vidio značajan dobitak u vrhunskim performansama poziva. U teoriji biste barem trebali gubiti osjetljivost oko regija s crne liste ako ne uklonite čitajuća područja koja se preklapaju s crne liste, ali morate se zapitati želite li ipak vjerovati takvim vrhovima. Za ostale korake QC-a, barem uz deepTools, uz svaki alat pružamo parametar koji određuje BED datoteku regija s crne liste koje treba preskočiti.
Osim toga, mnogo je manje regija s crne liste u novijim gradnjama genoma ( GRCh38 i GRCm38), tako da je ovo općenito manje problem s njima.