Pitanje:
Procjenjuje li GISTIC (v 2.0) pojačane / izbrisane vjerojatnosti na pojedinačnom uzorku?
Emanuel
2017-05-26 03:47:46 UTC
view on stackexchange narkive permalink

Procjenjuje li GISTIC 2.0 pozadinski model:

G = -log (Vjerojatnost | Pozadina)

permutiranjem unutar uzorka ili u svim uzorcima u skupu?

U radu se opisuje vjerojatnosna metoda bodovanja koja se temelji na permutacijama, ali nisam mogao razumjeti da li se ta permutacija izvodi samo u uzorku. Čini se da stranica dokumentacije sugerira više uzoraka, ali to bi značilo da skupovi različitih veličina mogu dovesti do različitih ishoda na uzorku uzorka.

U osnovi, je li važno je li skup sastoje se od, na primjer, 10 uzoraka istog tkiva podrijetla ili ~ 1000 iz više tkiva?

Hvala,

Proširio sam malo svoje pitanje.
Jedan odgovor:
llrs
2017-05-28 16:40:17 UTC
view on stackexchange narkive permalink

Čini se da nema puno razlika između GISTIC 1.0 i 2.0, kako se kaže:

Kao i kod GISTIC 1.0, P-vrijednosti dobivamo za svaki marker uspoređujući rezultat na svakom lokusa na pozadinsku raspodjelu rezultata generiranu slučajnom permutacijom mjesta markera u svakom uzorku

Ali na dopunskom materijalu GISTIC-a 1.0 postoji detaljnije objašnjenje metode. Pogledajte odjeljak "Faza 2":

Drugo, uspoređujemo ove G-rezultate s očekivanom raspodjelom rezultata ako su uočene samo slučajne aberacije. Ova se raspodjela može utvrditi brisanjem genoma nakon permutiranja mjesta markera unutar svakog uzorka; umjesto toga izvodimo polutačnu procjenu.

Nadalje, u drugom odjeljku ("Faza 2: Skupljanje podataka različitih tumora radi razlike između aberacija vozača i putnika") stoji:

Da bismo utvrdili koje će aberacije identificirane u fazi 1 vjerojatno predstavljati pokretačke događaje, agregiramo podatke iz svih tumora korištenih u analizi kako bismo generirali sažete bodove za pojačanja, brisanja i LOH. Statistička značajnost svake ocjene utvrđuje se usporedbom s raspodjelom rezultata dobivenih svim permutacijama podataka (pomoću polueksaktne aproksimacije), uz korekciju za ispitivanje višestrukih hipoteza.

Međutim, čini se da je relevantni odjeljak (dopunskih materijala) "Generacija nulske hipoteze: analitička izvedba nule distribucije", gdje opisuje upotrijebljenu polueksaktnu približnu vrijednost. >

U dopunskoj datoteci opisuje je kao "Generiraj sve permutacije SNP oznaka unutar svakog uzorka za simulaciju skupova podataka sa slučajnim aberacijama"

Zaključak :

Čini se da se pozadinske vjerojatnosti izračunavaju u uzorku.

Ne mogu reći je li važno kako su skupovi konstituirani, ali rekao bih da su što su skupovi širi, to će se bolja procjena strukturnih varijacija izvoditi, ali učinit će se ista procjena pozadine.

U konačnici možete provjeriti kod programa ili testirati s 10 uzoraka i zamijeniti jedan od njih da biste vidjeli mijenjaju li se rezultati u skladu s tim.

Hvala, da, čini se da je u uzorku. Napravit ću test istog uzorka s različitim skupovima podataka i ovdje ću izvijestiti kasnije.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...