Pitanje:
Može li se prilagođena datoteka GRCh38 .gtf koristiti s bilo kojom zakrpom objavljenom GRCh38?
TasosGlrs
2017-06-09 14:15:27 UTC
view on stackexchange narkive permalink

Dobio sam prilagođenu GRCh38.79 .gtf datoteku (izmijenjenu da nema MT gena) i od nje moram stvoriti referentni genom (za cjevovod 10xGenomics CellRanger). Pretpostavljam da je .79 dio Ensembl broj, koji je prema ovom popisu arhiva ensembl uparen s zakrpom GRCh38.p2.

Trebam li koristiti fasta datoteku ove zakrpe, ili bilo bi dobro koristiti bilo koju od zakrpa GRCh38?

Jeste li razmišljali poslati 10xGenomics e-poštom i pitati? Već im plaćate novac za njihove proizvode, pa će odgovoriti.
Znam kako napraviti referentni genom pomoću cellranger-a, u tom bi slučaju oni mogli pomoći. Moje pitanje je više o tome kako funkcionira GRCh ## verzija, za koju mislim da je ovdje bolje i definitivno brže mjesto za postavljanje, a ne 10xGenomics.
Različita izdanja Ensembla povezana su s genomima s različitim kontigovima zakrpa, pa postaje pitanje može li njihov softver obraditi nedostajuće kontigove.
U redu, točno! To bih pitanje trebao postaviti njima. Hvala @DevonRyan. Međutim, ako je njihov odgovor pozitivan, bi li ipak bilo znatno bolje koristiti oba dijela istog izdanja ili to ne bi toliko razlikovalo?
Ako ne pokvari njihov softver, to ne bi trebalo biti važno u svakom slučaju :) U stvarnosti je trivijalno ukloniti cijeli kromosom iz GTF-a, zato samo upotrijebite GTF / fasta iz najnovijeg izdanja Ensembla i dobit ćete malo pouzdaniji rezultati.
BTW, ohrabrite se da objavite njihov odgovor, od tada će biti indeksiran na googleu.
Jedan odgovor:
tweirick
2017-06-11 04:09:04 UTC
view on stackexchange narkive permalink

Točan sklop možete vidjeti ako pogledate datoteku README na Ensemblovoj stranici za preuzimanje genoma. ftp://ftp.ensembl.org/pub/release-89/fasta/homo_sapiens/dna/README

Kao što vidite, trenutni sklop je GCA_000001405.25. Ensembl 79 koristi verziju GCA_000001405.17. Možete očekivati ​​neke razlike između inačica sklopa.

Ako pogledate https://www.ncbi.nlm.nih.gov/assembly?term=GRCh38&cmd=DetailsSearch

Možete vidite da je dodano 20.466.394 bp od 17 -> 25. Ovo je samo oko 0,6% promjene, pa pretpostavljam da nema toliko razlike između ovih verzija. Međutim, da sam na vašem mjestu, koristio bih odgovarajuću verziju Ensembla. Još bi bolje bilo koristiti najnoviju verziju Ensembla, jer se ne mogu mijenjati samo primarni slijed genoma, već i položaji gena između verzija ( https://doi.org/10.1093/bib/bbw017) .



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...