Pitanje:
Kako se razlikuju algoritmi uskog i širokog vrha MACS2?
Ian Sudbery
2017-05-20 05:21:09 UTC
view on stackexchange narkive permalink

Alat za vršno pozivanje MACS2 može pozvati vrhove u načinu uskog vrha (za fokusirane signale poput transkripcijskog faktora ChIPseq) ili širokom piku (za više defuse signala, poput određenih modifikacija histona).

Algoritam za pozivanje uskog vrha dobro je opisan u publikaciji MACS. Ali ne nalazim puno dokumentacije o tome kako se vršno pozivanje razlikuje u modu širokog vrha. Priručnik sadrži samo sljedeće:

--broad

Kad je ova zastavica uključena, MACS će pokušati sastaviti široka područja u BED12 (format sličan genskom modelu ) stavljanjem obližnjih visoko obogaćenih područja u široko područje s labavim rezanjem. Široko područje kontrolira se drugim presjekom - širokim presjekom. Maksimalna duljina duljine širokog područja je 4 puta d od MACS-a

Ali ovo zapravo ne opisuje točno kako se to izvodi.

Pa, koji algoritam MACS koristi za pozivanje širokih vrhova?

Pronašao sam [algoritam] (https://github.com/taoliu/MACS/blob/24a1eab9fe7e885c27a37dbac2efb99d6da8dc74/MACS2/IO/BedGraph.pyx#L594), ali iskreno nisam uspio dobiti / osim konstrukcije na liniji 629. ..
Jedan odgovor:
#1
+10
Daniel Kim
2017-05-21 02:38:55 UTC
view on stackexchange narkive permalink

Ključna funkcija je call_broadpeaks :

Opis priložen uz funkciju kaže:

Ova funkcija pokušajte pronaći obogaćena područja unutar kojih su rezultati kontinuirano veći od zadate granične vrijednosti za razinu 1 i povežite ih pomoću jaza iznad granične vrijednosti 2 s maksimalnom duljinom lvl2_max_gap.

scoring_function_s: simboli funkcija za izračunati rezultat. 'p' za pscore, 'q' za qscore, 'f' za promjenu nabora, 's' za oduzimanje. na primjer: ['p', 'q']

lvl1_cutoff_s: popis graničnih vrijednosti u visoko obogaćenim regijama, što odgovara funkcijama bodovanja.

lvl2_cutoff_s: popis graničnih vrijednosti u manje obogaćenim regijama , što odgovara funkcijama bodovanja.

min_length: minimalna duljina vrha, zadana vrijednost 200.

lvl1_max_gap: maksimalni razmak za spajanje obogaćenih vrhova u blizini, zadana vrijednost 50.

lvl2_max_gap : maksimalna duljina regija povezivanja, zadano 400.

Vratite i općeniti PeakIO objekt za visoko obogaćena područja i praznine za široka područja u BroadPeakIO.

Da biste dali osnovno objašnjenje, čini se da je algoritam (ukratko) sljedeći:

  1. Pozvane su dvije odvojene razine vrhova, razina 1 (veći pval, tj. značajniji) i razina 2 (niži pval) ). Razinom 1 upravlja -p , a razinom 2 --broad-cutoff . Kada se pozove svaki set vrhova, oni su odmah povezani parametrom max jaz za svaki skup.

  2. Zatim, pod pretpostavkom da bi svi vrhovi razine 1 trebali biti unutar vrhova razine 2 (ovo je izričita pretpostavka MACS2), algoritam grupira vrhove razine 1 unutar vrhova razine 2 da bi se dobio široki vrh.

...

Ovo ima nekoliko implikacija:

  1. Pozivi sa širokim vrhom doista dolaze samo s vrhova razine 2 (+ povezivanje). Pozivi vršnih razina 1 omogućuju vam razlikovanje potpikova (tako da možete imati praznine u vrhovima).

  2. Osim povezivanja, pozivi širokog vrha bili bi isti kao pozivi uskog vrha, ako ste oba pozvali s istim pval pragom (na primjer, ako postavite --broad-cutoff 0,1 u načinu širokog vrha i -p 0.1 za način uskog vrha)

Možete li pojasniti u svom odgovoru da je "viši pval" zapravo "niža" ili "značajnija" vrijednost p, a da je "niži pval" zapravo vrijednost "veća" ili "manje značajna" vrijednost p? Predviđam da se netko zbuni zbog formulacije.
Dodano pojašnjenje - hvala na ulovu!


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...