Pitanje:
Kako ispravno nazvati VCF datoteku pomoću oštećene DNA? (IonTorrent i FFPE)
user36196
2019-01-31 00:34:49 UTC
view on stackexchange narkive permalink

UREDI: Ažuriram ovo pitanje kako bih ga učinilo specifičnijim za moj problem.

Za kontekst - izvorno pitanje prije uređivanja:

Kako mogu dobiti mjernu vrijednost deaminacije kada izvođenjem poziva varijante pomoću pozivatelja varijante IonTorrent, i drugo, kako ispraviti svoje pozvane varijante za deaminaciju kako bih osigurao da one ne pružaju lažne pozitivne rezultate za nizvodnu analizu?

Pozadina

Pozivam varijante koristeći IonTorrent TorrentSuite na DNA koja je sekvencirana iz tkiva ugrađenog u parafin (FFPE). To ima glavnu poteškoću jer se bez dodavanja uracil-N-glikozilaze, neki od Ts u izvornoj DNA deaminiraju na Cs, što se nakon sekvenciranja i pozivanja varijanti može prikazati kao mutacija, bilo kao T> C prijelazi ili G> A (iz suprotnog lanca, zbog PCR-a u pripremi u knjižnici). Nemam pojma koliko su dugo ti uzorci bili pohranjeni bez UNG-a prije sekvenciranja.

TVC (Torrent Variant Caller) daje metriku deaminacije (u osnovi zbroj T> C i G> A varijanti nad svim varijantama tzv.), a za naše uzorke najveća viđena vrijednost je ~ 0,92. Naivno obrađene inačice pokazuju da za ove uzorke prijelazi C> T / T> C prevladavaju preostale varijante među mojim uzorcima.

Primjena

Moj slučaj upotrebe je sljedeći: ovo su medicinski uzorke koje je pregledao patolog (dakle FFPE tretman), a ja želim utvrditi koje su varijante predviđajuće ishoda, stoga imam dva potencijalno kontradiktorna cilja: smanjiti lažne pozitivne rezultate i uhvatiti rjeđe inačice koje mogu imati prediktivnu snagu.

T>C and C>T transitions

Pitanje

  • S obzirom na IonTorrent varijantu pozivanja cjevovoda (sekvenciranje > BAM datoteka> TVC> VCF datoteka sa statistikom deaminacije):
    • (Q1) Postoji li način ispravljanja izlaznog VCF radi uklanjanja pogrešaka prijelaza i deaminacije?
    • (Q2) Alternativno, postoji li niz filtara koji se koriste u bcftools za smanjenje učinka pogrešaka na način na koji se nazivaju varijante?
koja je vaša namijenjena čitanje u nastavku? Možda ih uopće neće biti potrebno ispraviti.
Želim uzeti svoje uzorke i zaključiti koje varijante koreliraju s različitim odgovorima na liječenje u kliničnijem okruženju, pa mi nije potreban nikakav signal prekriven ovom C> T T> C bukom
Dva odgovori:
conchoecia
2019-01-31 03:05:22 UTC
view on stackexchange narkive permalink

Mjesta koja su deaminirana često se nazivaju abasičnim mjestima.

P1: Kako dobiti mjerne podatke o oštećenju DNA?

Možda biste trebali provjeriti mapDamage - ovaj se softver koristi za izvođenje takvih vrsta analiza i izradu crteža vrsta oštećenja DNA uz čitanje sekvenciranja.

P2: Kako ispraviti abasična mjesta i druge pogreške oštećenja DNA?

Možete koristiti svoj odabir softvera za korekciju pogrešaka na temelju kmera ili poravnanja. Pogreške će biti slučajne i ako je dubina sekvenciranja dovoljna, pogrešni kmeri na krajevima očitavanja ispravit će se. Međutim, ovisno o tome što pokušavate učiniti niz čitanja s vašim čitanjima, možda će vam biti bolje poslužiti ako ne ispravljate očitavanja, a kasnije se bavite prijelazima / oštećenjima.

To je u redu, ali pokušavam kombinirati neke starije inačice pod nazivom IonTorrent s inačicama koje sam morao nazvati, tako da nemam pristup izvornim mapiranim datotekama za čitanje za sve uzorke. U osnovi sam pitao za koje postavke pokušati dobiti procjenu deaminacije i kako to ispraviti nakon izrade vcf-a. Želim uzeti svoj c. 151 uzorak i zaključite o tome koje varijante koreliraju s različitim odgovorima na liječenje u kliničnijem okruženju, pa zato što nema nikakvog signala prekrivenog ovom C> T T> C bukom ono što trebam
Otada sam pronašao statistiku deaminacije kako je pruža TVC (pozivatelj varijante TorrentSuite), ali svejedno bih želio znati kako postupati s navedenim brojem i kako filtrirati moje VCF-ove kako bi ignorirali lažne pozitivne posljedice koje se javljaju zbog ovog mehanizma.
user36196
2019-02-07 17:08:49 UTC
view on stackexchange narkive permalink

Nakon pregleda jednog od mojih uzoraka (s procijenjenom metrikom deaminacije, udjelom nazvanih SNP-a koji se sastoje od prijelaza C> T ili G> A, 0,837), ovo izgleda kao jednostavan postupak filtriranja. Gledajući frakciju manjeg alela (AF) i ocjenu kvalitete (-10 log10 (p-vrijednost)) po tipu SNP-a: AF v QUAL per SNP type može se vidjeti da C> T i G> Prijelazi vjerojatno uzrokovani deaminacijom (i PCRingom deaminirane DNA da bi se došle do knjižnica) sve nakupine u donjem desnom dijelu grafikona - niska AF i niska QUAL, tako da se postavljaju pragovi lijevo (viša QUAL) i iznad (viša AF) grupe će ih ukloniti iz pozvanih varijanti.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 4.0 licenci pod kojom se distribuira.
Loading...