Transkripcia je proces prepisu genetickej informácie z DNA do RNA. Špeciálnou výnimkou je reverzná transkripcia (typická pre retrovírusy a telomerázu), pri ktorej sa naopak podľa RNA predlohy syntetizuje DNA. Syntetizovaný reťazec RNA sa nazýva transkript a hlavným enzýmom tohto procesu je RNA-polymeráza.
Intenzita transkripcie je súčasťou širšieho procesu génovej expresie (celkovej realizácie genetickej informácie od génu až k funkčnému proteínu). Gény s vysokou expresiou sa prepisujú častejšie a vo väčšej miere.
Rozlišujeme niekoľko typov produktov transkripcie:
| typ RNA | anglický názov | skratka | miesto syntézy |
|---|---|---|---|
| mediátorová RNA | messenger RNA | mRNA | jadro |
| transferová RNA | transfer RNA | tRNA | jadro |
| ribozomálna RNA | ribosomal RNA | rRNA | hlavne jadierko |
| malé jadrové RNA | small nuclear RNA | snRNA | jadro |
| malé jadierkové RNA | small nucleolar RNA | snoRNA | jadierko |
| regulačné RNA | micro RNA, small interfering RNA, long non-coding RNA | miRNA, siRNA, lncRNA | jadro |
Okrem mRNA sa ostatné typy RNA molekúl zvyknú nazývať termínom nekódujúce alebo funkčné RNA, pretože sa neprekladajú do proteínov, ale svoju regulačnú či štruktúrnu funkciu vykonávajú priamo ako molekuly RNA (napríklad umlčiavaním génov cez RNA interferenciu).
Všeobecná štruktúra génu link
Gén je kompletná sekvencia nukleovej kyseliny nesúca informáciu pre syntézu funkčného produktu. Rozlišujeme:
- štruktúrne gény − ktorých poradie nukleotidov sa prepisuje do mRNA a určuje tak priamo poradie aminokyselín a primárnu štruktúru polypeptidov/proteínov
- neštruktúrne gény − kódujú funkčné tRNA, rRNA a iné regulačné RNA
- regulačné gény − niektoré zdroje takto rozlišujú gény, resp. úseky DNA, ktoré kódujú primárnu štruktúru bielkoviny s funkciou induktora alebo represora génovej expresie
Úsek DNA, z ktorého sa syntetizuje jedna súvislá molekula RNA, sa nazýva transkripčná jednotka. U prokaryotov z dôvodu metabolickej ekonomiky obsahuje jedna transkripčná jednotka (operón) často viacero za sebou nasledujúcich génov. Vzniká tak polycistronická mRNA (jeden transkript obsahuje viacero čítačích rámcov a kóduje viacero polypeptidových reťazcov). U eukaryotov sa typicky tvorí monocistronická mRNA (jeden transkript nesie informáciu len pre jeden polypeptidový reťazec).
Nie celý gén podlieha transkripcii. Prvý prepisovaný nukleotid na DNA má pozíciu +1. Oblasť pred týmto štartovacím bodom má záporné číslovanie (nula neexistuje, pred +1 je hneď -1) a nazýva sa upstream (angl. proti prúdu). Oblasť za štartom (do plusových hodnôt) je downstream (angl. po prúde).
Kľúčovou upstream súčasťou génu je promótor. Slúži na rozpoznanie génu RNA-polymerázou a na iniciáciu transkripcie. Obsahuje evolučne konzervované, tzv. konvenčné sekvencie (konsenzuálne sekvencie), na ktoré sa viažu transkripčné faktory. Príkladom sú známe TATA boxy (Hognessov u eukaryotov, Pribnowov u prokaryotov) alebo CAAT boxy, ktorých prítomnosť a umiestnenie sa líšia v závislosti od typu bunky.
Všeobecný priebeh transkripcie link
Priebeh transkripcie môžeme podobne ako replikáciu DNA rozdeliť na 3 fázy:
- iniciácia
- elongácia
- terminácia
Iniciácia transkripcie link
Zahŕňa naviazanie RNA-polymerázy na promótor, ktorý predstavuje presne sekvenčne definovanú oblasť na DNA. Prokaryotický a eukaryotický promótor sa od seba odlišujú zložitosťou aj primárnou štruktúrou (u prokaryot pomáha polymeráze σ-faktor, kým u eukaryot komplexné transkripčné faktory). Iniciačná fáza končí zahájením syntézy reťazca RNA v smere 5'–3' na základe komplementarity báz len voči jednému vláknu opačnej polarity (3'–5'), pre ktoré sa používajú pomenovania matricový reťazec, templátový reťazec (angl. template strand) alebo negatívny reťazec. RNA-polymeráza na rozdiel od replikácie nevyžaduje pre svoju funkciu iniciačný primer.
Elongácia transkripcie link
RNA-polymeráza postupne pridáva nukleozid-5'-monofosfáty na 3'-koniec reťazca RNA, pričom sa posúva po kódujúcom reťazci DNA. Celú molekulu RNA transkriptu syntetizuje jedna molekula RNA-polymerázy. Na rozdiel od replikácie DNA, ten istý gén môže byť (a vždy aj je) prepisovaný mnohými polymerázami súčasne. Počas elongácie sú potrebné aj topoizomerázy na uvoľnenie torzného napätia, pretože RNA-polymeráza pred sebou vytvára pozitívne superhelixy (previnutú DNA) a za sebou negatívne (podvinutú DNA).
Terminácia transkripcie link
Predstavuje zastavenie transkripcie a uvoľnenie polymerázy. U prokaryot tento proces riadia špecifické terminačné sekvencie alebo tzv. ρ-faktor (ró-faktor), u eukaryot je signálom polyadenylačná sekvencia.
U eukaryotov primárny transkript (v prípade mRNA tzv. pre-mRNA alebo hnRNA) následne podstupuje post-transkripčné úpravy, čím vzniká definitívna zrelá (maturovaná) RNA.
Úloha RNA-polymeráz link
RNA-polymerázy sú enzýmy, ktoré katalyzujú syntézu jednovláknového reťazca RNA z voľných nukleozid-5'-trifosfátov. Odštiepenie pyrofosfátu z týchto substrátov zároveň poskytuje energiu pre vytvorenie fosfodiesterovej väzby (transkripcia teda prebieha bez priamej spotreby iného bunkového ATP). Podobne ako DNA-polymerázy, dokážu polymerizovať reťazec výlučne v smere 5'–3'. RNA-polymeráza má však v porovnaní s DNA-polymerázou veľmi nízku opravnú proof-reading aktivitu, čo znamená, že počas elongácie nevyštepuje každý nesprávne zaradený nukleotid. Vyššia chybovosť však bunke neškodí, pretože RNA neslúži na trvalé uchovanie genetickej informácie, má obmedzenú životnosť a daný gén je prepisovaný v obrovskom množstve kópií, takže občasná chyba v niektorých transkriptoch neovplyvní celkovú funkciu.
Prokaryoty majú len jeden univerzálny druh RNA-polymerázy, ktorá katalyzuje syntézu RNA zo všetkých génov. Eukaryoty naopak používajú viacero špecializovaných typov RNA-polymeráz, ktoré zabezpečujú transkripciu z rôznych génových skupín:
- RNA-polymeráza I – vyskytuje sa v jadierku, transkribuje väčšinu génov pre rRNA
- RNA-polymeráza II – vyskytuje sa v jadre, transkribuje štruktúrne gény (syntéza mRNA) a gény pre niektoré malé RNA
- RNA-polymeráza III – vyskytuje sa v jadre, transkribuje gény pre tRNA, 5S-rRNA (súčasť veľkej ribozómovej podjednotky) a ďalšie regulačné a malé RNA
Prokaryotická transkripcia link
Prokaryotická transkripcia je v mnohom jednoduchšia ako eukaryotická. Prokaryotický promótor obsahuje dve kľúčové funkčné oblasti:
- GACA-box – konvenčná sekvencia 5'-TTGACAT-3' v pozícii ~(-35)
- TATA-box (Pribnowov box) – konvenčná sekvencia 5'-TATAAT-3' v pozícii ~(-10)
Na promótor sa viaže jediná prokaryotická RNA-polymeráza pomocou špecifickej podjednotky – σ-faktora, ktorý zabezpečuje špecifické rozpoznanie génu. Polymeráza po iniciácii rozvinie dvojzávitnicu DNA, čím vznikne transkripčná bublina (s veľkosťou približne 18 bázových párov). Následne sa σ-faktor uvoľní, na jeho miesto sa naviaže proteín NusA a vzniká plne funkčná elongačná forma enzýmu.
Počas elongácie RNA-polymeráza postupuje po vlákne rýchlosťou približne 60 nukleotidov za sekundu. Dvojzávitnica sa pred ňou plynule odvíja a za ňou okamžite spája. Syntetizovaný reťazec RNA netvorí s DNA trvalé dvojvlákno, ale je z matrice bezprostredne vytesnený. K tomuto procesu bunka nepotrebuje žiadne prídavné enzýmy.
Terminácia transkripcie končí v mieste terminátora dvoma spôsobmi. Prvý, nezávislý od ρ-faktora, súvisí so syntézou špecifickej, na uracil bohatej sekvencie RNA (terminátorová sekvencia na DNA je v tomto mieste tvorená niekoľkými za sebou idúcimi adenínmi). Keďže medzi adenínom a uracilom vznikajú len dva vodíkové mostíky (zatiaľ čo pár C-G držia tri vodíkové mostíky), je toto spojenie RNA-DNA termodynamicky oveľa slabšie. To má za následok samovoľné vyviazanie enzýmu z DNA a ukončenie transkripcie. Druhý spôsob prebieha závisle od ρ-faktora (ró-faktora), kedy tento pomocný proteín priamo katalyzuje vyviazanie RNA-polymerázy na špecifickej terminátorovej sekvencii (ktorá neobsahuje opakovania adenínov).
Keďže transkripcia prebieha priamo v cytoplazme, v prípade štruktúrnych génov sa na mRNA viažu ribozómy už počas jej samotnej tvorby. Transkripcia je tak okamžite spriahnutá s transláciou a transkript nevyžaduje absolútne žiadne post-transkripčné úpravy. Navyše, prokaryotická mRNA je často polycistronická – prepisuje naraz viacero štruktúrnych génov usporiadaných za sebou. Celá táto stratégia zodpovedá prežitiu najrýchlejšie sa množiaceho jedinca s minimálnou spotrebou materiálu a energie.
Eukaryotická transkripcia link
Eukaryotická RNA-polymeráza II vyžaduje pre naviazanie na gén a začatie transkripcie prítomnosť viacerých funkčných oblastí promótora. Najdôležitejšie konvenčné sekvencie (boxy) sú:
- TATA-box (Hognessov box) – sekvencia 5'-TATAAAA-3', nachádzajúca sa v pozícii -34 až -26
- CAAT-box (čítaj „kæt box“) – sekvencia 5'-GGCCAATCT-3', v pozícii -75 až -80
- GC-box – sekvencia 5'-GGGCGG-3', v pozícii ~(-90)
Na rozdiel od prokaryotickej polymerázy, eukaryotická RNA-polymeráza II nedokáže začať transkripciu sama. Zúčastňuje sa tu viacero pomocných proteínov, ktoré sa súhrnne nazývajú transkripčné faktory (TF). Iniciácia začína väzbou faktora TFIID (prostredníctvom jeho TBP proteínu) priamo na TATA-box. Následne sa prikladá RNA-polymeráza II, čím vzniká prediniciačný komplex. Kľúčovým krokom je príchod faktora TFIIH, ktorý funguje ako helikáza (rozpletá dvojzávitnicu) a zároveň ako kináza – fosforyluje RNA-polymerázu II, čím ju aktivuje k transkripcii. GC-box a CAAT-box urýchľujú iniciáciu väzbou s ďalšími faktormi. Od tohto momentu už RNA-polymeráza II katalyzuje syntézu (elongáciu) bez pomoci transkripčných faktorov.
Koniec transkripcie štruktúrneho génu u eukaryotov neurčuje presný terminátor, ale tzv. polyadenylačný signál (na DNA sekvencia AATAAA, ktorá sa do RNA prepíše ako AAUAAA). Špecifická endonukleáza rozpozná tento signál a približne 10 až 30 nukleotidov za ním primárny transkript odštiepi. Čerstvo syntetizovaný primárny transkript sa nazýva pre-mRNA (alebo heterogénna jadrová RNA – hnRNA, angl. heterogenous nuclear RNA) a pred opustením jadra musí prejsť úpravami.
Post-transkripčné úpravy link
Hlavný dôvod, prečo musí byť eukaryotická pre-mRNA modifikovaná, je ten, že musí byť bezpečne transportovaná z jadra cez jadrovú membránu do cytoplazmy, kde následne podlieha translácii na ribozómoch. Úpravy ju chránia pred degradáciou cytoplazmatickými enzýmami a umožňujú jej správne rozpoznanie. Eukaryotická pre-mRNA sa upravuje na obidvoch koncoch a vo vnútri sekvencie v troch hlavných krokoch:
- úprava 5'-konca (čiapočka / cap) – na 5'-koniec sa netypickou 5'–5' trifosfátovou väzbou pripája modifikovaný guanínový nukleotid (7-metylguanozín). Chráni mRNA pred deštrukciou exonukleázami a zabezpečí, že RNA bude neskôr správne rozpoznaná malou podjednotkou ribozómu.
- úprava 3'-konca (poly-A chvost) – úprava súvisí s polyadenylačným signálom. Enzým poly(A)-polymeráza za ním pripojí k molekule reťazec 100 až 250 adenylových zvyškov. Chráni transkript z opačnej strany a zohráva dôležitú rolu v tom, koľkokrát sa bude môcť daná mRNA použiť na transláciu.
- zostrih (splicing) intrónov – táto posledná modifikácia (angl. splicing – čítaj „splajsing“) súvisí so zložením eukaryotických génov, ktoré sú nespojité. Skladajú sa z kódujúcich úsekov (exónov) a nekódujúcich úsekov (intrónov), ktoré musia byť z pre-mRNA odstránené. Tento proces katalyzuje spliceozóm – komplex proteínov a malých jadrových RNA (snRNA). Spliceozóm bezchybne rozozná hraničné sekvencie intrónu (na 5'-konci začína sekvenciou GU a na 3'-konci končí AG), enzymaticky ho vyštiepi (do tzv. lasovitej formy) a exóny spojí dokopy. Tým vznikne súvislá zrelá mRNA pripravená na transláciu.
V ľudskom genóme má každý gén priemerne až 9 intrónov. Platí, že dlhé gény majú aj dlhé intróny. Extrémnym príkladom je gén pre proteín dystrofín, ktorého pre-mRNA je dlhá vyše 2,4 milióna nukleotidov (megabáz), avšak po vystrihnutí 78 intrónov sa skráti na zrelú mRNA s dĺžkou len 14-tisíc nukleotidov! Intróny sa prakticky vôbec nevyskytujú u prokaryot, pretože akákoľvek strata zbytočného úseku DNA im prináša okamžitú evolučnú výhodu v rýchlosti delenia bunky.