We are searching data for your request:
Upon completion, a link will appear to access the found materials.
Galiausiai pasiekiame tašką, kuriame norime ištirti RNR struktūrą. 10.7
Optimali struktūra bus ta, kurios laisvoji energija yra minimali ir pagal susitarimą neigiama energija stabilizuojasi, o teigiama – nestabilizuojasi. Naudodami šią sistemą, galime naudoti dinaminį programavimą (DP) optimaliai struktūrai apskaičiuoti, nes 1) ši taškų schema yra adityvi 2) neleidome pseudo mazgų, o tai reiškia, kad galime padalyti RNR į du mažesnius, kurie yra nepriklausomi, ir išspręsti problemą. problemų dėl šių mažesnių RNR.
Norime rasti DP matricą Eij, kuriame apskaičiuojame mažiausią laisvąją energiją poseikai nuo i iki j. Pirmasis požiūris į tai yra Nussinovo algoritmas.
Nussinovo algoritmas
Pirmą kartą šios problemos rekursijos formulę aprašė Nussinovas 1978 m.
Šio algoritmo intuicija yra tokia: atsižvelgiant į poseką [i,j], nėra briaunų, jungiančių su i-ąja baze (tai reiškia, kad ji nesuporuota), arba yra briauna, jungianti i-ąją bazę su k-ąja baze, kur i < k ≤ j (tai reiškia, kad i-oji bazė yra suporuota su k-ąja baze). Tuo atveju, kai i-oji bazė yra nesuporuota, posekos energija Ei,j tiesiog redukuojasi iki posekos energijos nuo i + 1 iki j, Ei+1,j. Tai pirmasis Nussinovo pasikartojimo santykių terminas. Tačiau jei i-oji bazė yra suporuota su k-ąja baze, tada Ei,j sumažinama iki i,k poros energijos indėlio βi,k, pridėjus posekių, sudarytų dalijant [i + 1, j], energijos. k, Ei+1,k−1 ir Ek+1,j . Pasirinkus k, kuris šią reikšmę sumažina, gaunamas antrasis Nussinovo pasikartojimo santykio narys. Todėl optimali posekos energija yra mažiausia posekos energija, kai i-oji bazė yra suporuota su optimalia k-ąja baze ir kai i-oji bazė yra nesuporuota. Tai sukuria bendrą ryšį, aprašytą 10.8 pav.
Iš šio pasikartojimo santykio matome, kad DP matricoje bus visų i, j įrašų, kur 1≤i≤nandi≤j≤n ir ne RNR sekos ilgis. Kitaip tariant, matrica bus n ∗ n ir joje bus tik įrašai viršutiniame dešiniajame trikampyje. Matrica pirmiausia inicijuojama taip, kad visos įstrižainės reikšmės būtų lygios nuliui. Tada mes kartojame per i = n - 1 ... 1 ir j = i + 1 ... n (iš apačios į viršų, iš kairės į dešinę) ir užpildome kiekvieną įrašą pagal pasikartojimo ryšį. Bendras balas yra [1, n] posekos, kuri yra viršutiniame dešiniajame matricos kampe, rezultatas. 10.9 paveiksle pavaizduota ši procedūra.
Kai skaičiuojame minimalią laisvą energiją, dažnai domimės atitinkama kloste. Norint atkurti optimalų lenkimą iš DP algoritmo, atsekimo matrica naudojama rodyklėms nuo kiekvieno įrašo iki pirminio įrašo saugoti. 10.10 paveiksle aprašytas atgalinio sekimo algoritmas.
Šis modelis yra labai paprastas ir turi tam tikrų apribojimų. Nussinovo algoritmas, įgyvendintas naiviai, neatsižvelgia į kai kuriuos ribojančius RNR lankstymo aspektus. Svarbiausia, kad jame neatsižvelgiama į gretimų porų sąveiką, kuri yra gyvybiškai svarbus veiksnys (net labiau nei vandenilio ryšiai) RNR sulankstymui. 10.11 pav
Todėl į mūsų prognozę pageidautina integruoti biofizinius veiksnius. Pavyzdžiui, vienas iš patobulinimų yra energijos priskyrimas grafo paviršiams (struktūriniams elementams 10.12 pav.), o ne atskiroms bazių poroms. Tada bendra konstrukcijos energija tampa substruktūrų energijų suma. Sukrovimo energiją galima apskaičiuoti lydant oligonukleotidus eksperimentiškai.
Zukerio algoritmas
Todėl RNR struktūrai apskaičiuoti naudojame variantą, į kurį įkraunama energija. Tai vadinama Zukerio algoritmu. Kaip ir Nussinovas, daroma prielaida, kad optimali struktūra yra ta, kurios energijos pusiausvyra yra mažiausia. Nepaisant to, į jį įeina bendras energijos kiekis iš įvairių posistemių, kurį iš dalies lemia kaupimo energija. Kai kurie šiuolaikiniai RNR lankstymo algoritmai naudoja šį algoritmą RNR struktūros prognozėms.
Pagal Zukerio algoritmą turime spręsti keturis skirtingus atvejus. 10.13 paveiksle parodytas grafinis skaidymo etapų kontūras. Procedūrai reikia keturių matricų. Fij yra laisvoji energija iš bendros optimalios posekos xij struktūros. Naujai pridėtas pagrindas gali būti nesuporuotas arba gali sudaryti porą. Dėl
Pastaruoju atveju pristatome pagalbinę matricą Cij, kuriame yra laisvos optimalios x pastruktūros energijosij pagal apribojimą, kad i ir j yra suporuoti. Ši struktūra, uždaryta pagrindo pora, gali būti plaukų segtukas, vidinė kilpa arba kelių kilpų.
Plaukų segtuko dėklas yra nereikšmingas, nes nereikia tolesnio skaidymo. Vidinis kilpos korpusas taip pat paprastas, nes jis vėl sumažinamas iki to paties irimo žingsnio. Kelių kilpų žingsnis yra sudėtingesnis. Kelių kilpų energija priklauso nuo komponentų skaičiaus, t. Norint netiesiogiai sekti šį skaičių, reikia dviejų papildomų pagalbinių matricų. Mij turi optimalios x struktūros laisvąją energijąij pagal apribojimą, kad xij yra kelių kilpų, turinčių bent vieną komponentą, dalis. Mij1 turi optimalios x struktūros laisvąją energijąij pagal apribojimą, kad xij yra kelių kilpų dalis ir turi tiksliai vieną komponentą, uždarytą pora (i,k) su i < k < j. Idėja yra išskaidyti daugialypę kilpą į dvi savavališkas dalis, iš kurių pirmoji yra kelių kilpa su bent vienu komponentu, o antroji - kelių kilpa su tiksliai vienu komponentu ir pradedant bazine pora.
Šios dvi dalys atitinka M ir M1 gali būti toliau skaidomos į mums jau žinomas postruktūras, ty nesuporuotus intervalus, substruktūras, uždarytas bazine pora, arba (trumpesnes) kelių kilpų. (Rekursijos taip pat apibendrintos 10.13.
Tačiau iš tikrųjų kambario temperatūroje (arba ląstelės temperatūroje) RNR iš tikrųjų nėra vienos būsenos, o kinta termodinamine struktūros ansamblyje. Bazinės poros gali gana lengvai nutraukti savo ryšius, ir nors galime rasti absoliutų laisvosios energijos optimalumą, gali būti, kad yra kita neoptimali struktūra, kuri labai skiriasi nuo to, kurią numatė e, ir atlieka svarbų vaidmenį ląstelė. Norėdami išspręsti problemą, mes galime apskaičiuoti bazinių porų tikimybes, kad gautume struktūrų ansamblį, ir tada mes galime daug geriau įsivaizduoti, kaip RNR struktūra tikriausiai atrodo. Norėdami tai padaryti, naudojame Boltzmano faktorių:
[operatoriaus pavadinimas{Prob}(mathcal{S})=frac{exp (-Delta G(mathcal{S}) / R T)}{Z} onumber]
Tai suteikia mums tam tikros struktūros tikimybę termodinaminėje sistemoje. Turime normalizuoti temperatūrą naudodami skaidinio funkciją Z, kuri yra visų konstrukcijų svertinė suma, pagrįsta jų Boltzmano koeficientu:
[z = sum_ {s} exp (- Delta G ( mathcal {S}) / R T) nonumber ]
Šį ansamblį taip pat galime pavaizduoti grafiškai, naudodami taškų brėžinį, kad vizualizuotume bazinės poros tikimybes. Norėdami apskaičiuoti specifinę bazinės poros (i, j) tikimybę, turime apskaičiuoti skaidymo funkciją, kuri pateikiama pagal šią formulę:
[p_{ij}=frac{widehat{Z}_{i} Z_{i+1,-1} exp left(-eta_{j} / RT ight)}{Z} onumber ]
Norėdami apskaičiuoti Z (paskirstymo funkciją visoje struktūroje), naudojame rekursiją, panašią į Nussinovo algoritmą (žinomą kaip McCaskill algoritmas). Vidinė skaidinio funkcija apskaičiuojama naudojant formulę:
[Z_{ij}=Z_{i+1, j}+suma_{i+1 leq k leq j atop n_{k}=1} Z_{i+1, k-1} Z_{k +1, j} exp left(-eta_{ik} / RT ight) onumber]
Kiekvienas papildymas atitinka skirtingą mūsų sekos padalijimą, kaip parodyta kitame paveikslėlyje. Atminkite, kad pridėjimas padauginamas iš energijos funkcijų, nes jis išreiškiamas kaip eksponentinis.
Panašiai išorinio skaidinio funkcija apskaičiuojama ta pačia idėja, naudojant formulę:
atitinkančius skirtingus skilimus už bazinių porų ribų (i, j).