Pitanje:
Klasifikacija uzoraka na temelju ekspresije gena markera
GWW
2017-05-24 20:41:28 UTC
view on stackexchange narkive permalink

Imam nekoliko skupova gena markera koje mogu klasificirati uzorke RNA-seq pomoću polunadgledanog grupiranja. Želio bih automatizirati postupak, međutim, borim se kako bih pronašao idealan algoritam koji bi mogao generirati neku vrstu rezultata za marker gen postavljen iz datog uzorka.

Pretpostavljam da je ovo standardna analiza u mnogim skupinama, ali nisam siguran koje metode donose dobre rezultate u praksi.

Nedavno je bilo slično pitanje na Biostarsu koje nije dalo odgovore: https://www.biostars.org/p/239228/
Iznenađen sam. Čini se kao tako važan problem. Pogotovo s scRNA-seq koji dobiva popularnost.
Budući da ste spomenuli scRNA-seq podatke, možda će vas zanimati [Buettner * i ostali *] (https://www.nature.com/nbt/journal/v33/n2/full/nbt.3102.html): “ Računalna analiza heterogenosti stanica-stanica u podacima o sekvenciranju jednoćelijske RNA otkriva skrivene subpopulacije stanica “. Ne bavi se baš vašim problemom, ali prikazuje neke probleme povezane s identificiranjem staničnih populacija u scRNA-seq, koji su uglavnom izglađeni u skupnom RNA-sequ.
Jedan odgovor:
#1
+7
Peter Humburg
2017-05-25 04:32:41 UTC
view on stackexchange narkive permalink

Razmislio bih o korištenju potpisa ekspresije gena za klasifikaciju uzoraka (posebno podtipova raka, ali ista načela vrijede i za druge probleme ove vrste) jednim od klasičnih problema bioinformatike. Prilično je puno rada provedeno na metodama za dobivanje genskih setova koji pružaju dobre klasifikacijske performanse. To se malo razlikuje od vašeg problema jer već imate genski potpis, ali i dalje se može pokazati korisnim.

Ove će metode obično odgovarati modelu koji odabire (mali) broj gena iz podataka o ekspresiji širom genoma. koji razlikuju dotične tipove stanica / stanja, tj. oni potječu od genskog potpisa. Dobiveni model tada omogućuje klasifikaciju novih uzoraka. Uspjeh sam upotrijebio GeneRave u tu svrhu (ali imajte na umu da je ovo dizajnirano za podatke s mikrorezkama, nisam ga koristio s RNA-seq podacima i ne znam koliko se dobro drži ). Noviji članak koji se odnosi na ovu problematiku možete pronaći ovdje.

Pa kako vam to pomaže? Jedna od mogućnosti bila bi prilagodba jednog od ovih klasifikatora podacima podataka o ekspresiji gena za gene koje već znate kako bi se dobio model koji se zatim može automatski primijeniti na nove uzorke.

To je stvarno korisno hvala vam puno. Pokušat ću onima ili barem vidjeti kako mogu prilagoditi njihove metode.
Pridržavajući se @Peter Humbergovog upozorenja GeneRave-a koji je dizajniran za podatke s mikrorezkama, mogli biste `zumirati` transformirati svoje brojanje pomoću` limma` kako biste ih učinili * sličnima mikrorezkama *.
Kada trebam usporediti izraz cDNASeq s mikroravnom, koristim normalizaciju duljine prijepisa primijenjenu na DESeqovu VST transformaciju (koju nazivam 'VSTPk'). Više detalja o tome možete pronaći u odjeljku metoda našeg rada Th2 RNASeq: http: //dx.doi.org/10.1084/jem.20160470


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...