Pitanje:
Kako izračunati preklapajuće gene između dvije verzije bilješki genoma
holmrenser
2017-05-17 16:51:45 UTC
view on stackexchange narkive permalink

Imam dvije bilješke istog genoma generirane s različitim cjevovodima bilješki. Želim prepoznati preklapajuće genetske modele.

Važna značajka ovog genoma jest da postoji mnogo 'gena unutar gena', tj. genomodel u intronu drugog genomodela . Stoga, dva genemodela želim brojati kao preklapajuća se kada se njihove oznake egzona kodnih sekvencija preklapaju.

Korištenjem nečega poput bedtools presijecaju se jednostavno je izračunati preklapanje između bilješki na razini gena .

Međutim: Nisam siguran kako odabrati gene koji se preklapaju kada se preklapaju samo njihovi egzoni kodirajuće sekvence (značajke CDS-a).

Zašto ne izdvojite koordinate svojih CDS regija iz vaših krevet / gff datoteka, a zatim se bedtools presijecaju?
To bi me i dalje ostavilo samo s preklapajućim značajkama CDS-a. Na kraju želim znati _gene_. Zašto svoj komentar ne biste napisali u odgovor?
Jedan odgovor:
#1
+6
Gus
2017-05-17 19:56:36 UTC
view on stackexchange narkive permalink

Kratki odgovor: Po mom mišljenju, moj pristup bio bi izvući CDS eksone i pokrenuti bedtools na njima.

Još nekoliko pojedinosti: Kad izvučete eksone, obavezno im dodijelite sve ID-ove ako ih već nisu dodijeljeni i zabilježite koji ID-ovi "pripadaju" kojima geni. Sad kad dobijete eksone koji se preklapaju, znate da oni kodiraju i možete ih povezati s genima iz kojih potječu.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...