Pitanje:
Kako odabrati visokokvalitetne strukture iz banke proteinskih podataka?
marcin
2017-06-01 18:04:41 UTC
view on stackexchange narkive permalink

Modeli struktura pohranjenih u Proteinskoj banci podataka razlikuju se u kvaliteti, ovisno o kvaliteti podataka i stručnosti i strpljenju osobe koja je izgradila model. Postoji li dobro prihvaćen podskup unosa PDB-a koji ima samo "visokokvalitetne" strukture? U idealnom slučaju ove bi strukture bile reprezentativne za klase proteina u cijelom PDB-u.

na temelju pravog pitanja iz biologije.SE

Dva odgovori:
#1
+9
Davidmh
2017-06-01 18:55:33 UTC
view on stackexchange narkive permalink

Postoji vrlo lijepa baza podataka, pdbcull (u literaturi poznata i kao PISCES poslužitelj). Filtrira PDB za visoku razlučivost i smanjeni identitet sekvence. Čini se da se redovito ažurira. Ovisno o graničnim vrijednostima, dobivate između 3000 i 35000 struktura.

Ako ste posebno zainteresirani za rotamere, možda biste trebali pogledati top8000, gdje su provjerili za visoku razlučivost i dobre MolProbity rezultate. Oni također pružaju rotamer bazu podataka.

PDB također nudi vlastito klasteriranje. Prvo grupiraju sekvence, a zatim izvlače reprezentativnu strukturu za svaku na temelju čimbenika kvalitete ( 1 / razlučivost - R_value ). Prednost je u tome što je sveobuhvatan, ali imat ćete loše strukture kad nikad nisu dobivene dobre.

#2
+5
Rosalind Was Robbed
2017-06-15 03:56:46 UTC
view on stackexchange narkive permalink

Ako odlučite izvršiti vlastiti odabir PDB-a, razlučivost je vjerojatno prvo što ćete htjeti pogledati, a što je, kako Davidmh spominje, glavni kriterij za odabir RIBA. Strukture visoke kvalitete također će imati bolje vrijednosti R-faktora. Također možete dati prednost na temelju eksperimentalne tehnike, silaznim redoslijedom kvalitete:

Neutronska difrakcija, difrakcija X-zraka, NMR otopina / čvrsto stanje, elektronska mikroskopija / kristalografija, difrakcija vlakana, rasipanje otopine.

da, to su kriteriji iz RIBA, iako izgledaju prilično pojednostavljeno. Koristi se R-faktor, ali zanemaruje se jaz između R-faktora i Rfree. Razlučivost (pod pritiskom d_min) jedini je kriterij kvalitete podataka (cjelovitost podataka se zanemaruje). Nema provjere geometrije.
Odstupanje R-faktora i R-bez odlična je stvar koju treba pogledati, ali prema mom iskustvu, broj struktura koje obje izvještavaju na standardiziran način prilično je malen. BioJava ih je nedavno objavio, IIRC, i to je obično alat koji koristim.
[80,7%] (http://mmcif.wwpdb.org/dictionaries/mmcif_pdbx_v50.dic/Items/_refine.ls_R_factor_R_free.html) PDB struktura izvještava bez R, nešto manje od [86,8%] (http: // mmcif .wwpdb.org / rječnici / mmcif_pdbx_v50.dic / Items / _refine.ls_d_res_high.html) koji izvještava o razlučivosti.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...