Pitanje:
preslikavanje na preslikavanje preslikavanja između Affymetrixovih nizova
Prradep
2017-05-18 17:52:23 UTC
view on stackexchange narkive permalink

Zanima me identificiranje preslikavanja između različitih vrsta Affymetrixovih nizova. Svjestan sam da se preslikavanja gena i probeseta mogu izvući pomoću Ensemblove baze podataka Biomart.

  Ensembe gen id ENSG00000181019 preslikava se na 1. AFFY HG-U133_Plus_2's 210519_s_at2. AFFY HuGene-1_0-st-v1 8002303  

Postoji li način za izdvajanje mapiranja identifikovanih ID-ova između dva polja (npr. HG-U133_Plus_2, HuGene-1_0-st-v1)?

  npr.: 210519_s_at i 8002303  
Je li vaše pitanje kako pronaći preklapajuće skupove sondi između nizova? Ili kako uopće prepoznati setove sondi? Nije jasno.
Dodao sam primjer. Ima li ovo smisla sada?
Dakle, u osnovi možete doći do dva mapiranja genskih ID-ova iz Ensemblova Biomart-a. Točno? Što vas sprečava da se pridružite ove dvije tablice na temelju gena Ensembl? Možete koristiti funkciju `spajanje` u R ili` JOIN` izjavu u SQL-u.
@IakovDavydov ili Unix `join` bi također funkcionirali
Problem je u tome što sva preslikavanja nisu točno jedan na jedan. Bilo sonde HG-U133_Plus_2 ili HuGene-1_0-st-v1 mapiranje na jedan ensembl genski ID.
@Prradep ako objasnite koji je temeljni problem koji pokušavate riješiti, mogli bismo ponuditi bolji savjet
Ne biste trebali očekivati ​​da ćete vidjeti pojedinačna preslikavanja, pogledajte moj odgovor u nastavku.
Tri odgovori:
#1
+9
neilfws
2017-05-19 06:18:14 UTC
view on stackexchange narkive permalink

Ako je vaše pitanje: mogu li se ID-ovi probeseta s različitih platformi mapirati jedna na drugu na sličan način kao mapiranje sonda u gene, onda je odgovor: Da. BioMart omogućuje mapiranje gotovo svega što ima ID na bilo što drugo što ima ID.

BioMart možete koristiti bilo putem web sučelja ili programski. Kratki vodič za korištenje web sučelja za mapiranje HG U133 Plus 2 na HuGene 1.0:

  1. Idite na početnu stranicu
  2. Odaberite H sapiens Ensembl geni za vašu bazu podataka; Ljudski geni (GRCh38.p10) za vaš skup podataka
  3. Kliknite Filteri u lijevom stupcu
  4. Proširite "REGION", pomaknite se prema dolje do GENE i odaberite "Unesi ID sondi / probeseta mikromreže popis [savjetuje se maks. 500] "
  5. Odaberite ID-ove sonde AFFY HG U133 PLUS 2 i kopirajte / zalijepite ili prenesite popis, jedan po retku
  6. Kliknite Atributi slijeva -ručni stupac
  7. Pomaknite se, poništite ono što ne želite vidjeti i odaberite ono što radite, na primjer Gene Stable ID, AFFY HuGene 1 0 st v1 sonda i AFFY HG U133 Plus 2 sonda
  8. Na kraju kliknite "Rezultati" u izborniku pri vrhu lijevog stupca

I trebali biste vidjeti ovakav rezultat (vi morat ćete kliknuti gumb "Rezultati").

Ne biste trebali očekivati ​​da postoji mapiranje jedan na jedan iz dva razloga:

  • Geni imaju više transkripata i probeta mapiraju se u svaki transkript
  • Neki transkripti imaju više od jednog ispitivanja: u ovom slučaju, HuGene ID-ovi 8002301 i 8002303 mapiraju se u transkripte za ovaj gen

Napokon: evo programskog primjera koji koristi R / BioMart:

  knjižnica (biomaRt) mart.hs <- useMart ("ensembl", "hsapiens_gene_ensembl") rezultati <- getBM (atributi = c ("ensembl_gene_id", "affy_hugene_1_0_st_v1", "affy_hg_u133_plus_2"), filters = "affy_hp_u_mag_at_mat_at_at_txt_txt_t_19 .hs) rezultati ensembl_gene_id affy_hugene_1_0_st_v1 affy_hg_u133_plus_2
1 ENSG00000181019 8002301 210519_s_at2 ENSG00000181019 8002303 210519_s_at  
#2
+7
rmflight
2017-05-19 06:53:56 UTC
view on stackexchange narkive permalink

Umjesto biomaRta, također je moguće koristiti baze podataka za mapiranje ugrađene u sam Bioconductor, te mapirati od sonde do gena, a zatim od gena do sonde u drugoj. Neki R kod za pretvorbu između hgu133 i hgu95 koristeći isti ID sonde naveden u drugom:

  knjižnica (hgu133plus2.db) knjižnica (hgu95av2.db) query_probe <- "210519_s_at" hgu133_ensembl <- select (hgu133plus2.db, keys = query_probe, columns = "ENSEMBL") ensembl_hgu95 <- select (hgu95av2.db, keys = hgu133_ensembl $ ENSEMBL, keytype = "ENSEMBL", columns = "PROBEID" enjol_mblgbbb: imbgl: probEID, enblin, imb , prema = "ENSEMBL", sufiks = c (". 133", ".95"))  
#3
+2
rmflight
2017-05-19 06:57:32 UTC
view on stackexchange narkive permalink

Ostali odgovori objašnjavaju zašto možda ne postoji mapiranje jedan prema jedan između sondi.

Baza podataka AbsID vrši pretvorbu na temelju mapiranja sekvenci sonde u izgradnju genoma i zatim određuje preslikavanja na temelju preklapajućih koordinata poravnanja genoma. Ovo je stvarno korisno ako želite biti sigurni da dvije sonde zapravo vjerojatno mjere isti transkript.

Međutim, ovisi o obje sonde koje se poravnavaju s genomom.

Izjava o odricanju odgovornosti: Radio sam u grupi koja pruža alat za mapiranje AbsID.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...