Sekvenovanie DNA

Pod pojmom sekvenovanie DNA rozumieme určenie primárnej štruktúry, t.j. určenie poradia nukleotidov v reťazci DNA (sekvencie DNA). Znalosť genetickej informácie je nevyhnutným predpokladom výskumu v mnohých oblastiach súčasnej biológie, pretože umožňuje porozumieť molekulárnej podstate biologických procesov. Na základe znalosti sekvencie DNA je možné odvodiť sekvencie RNA a aminokyselinové sekvencie proteínov kódovaných daným úsekom DNA. Zároveň postupy sekvenovania DNA sú po experimentálnej stránke podstatne jednoduchšie a lacnejšie ako sekvenovanie RNA alebo proteínov.

Začiatky sekvenovania DNA siahajú do roku 1977, kedy boli uverejnené nezávisle na sebe dvomi tímami dve odlišné metódy sekvenovania:

  1. chemická metóda Maxama a Gilberta
  2. enzymatická metóda Sangera

Obidve metódy majú principiálne znaky rovnaké:

  • vytvorí sa súbor molekúl DNA s rôznou veľkosťou, ktoré sú zakončené konkrétnou bázou
  • tieto molekuly sa separujú elektroforeticky na géloch s rozlišovacou schopnosťou 1 nukleotid

Keďže menšie molekuly DNA migrujú v géli rýchlejšie, gél sa "číta" zo vzdialenejšieho miesta od jamiek smerom hore.

Chemická metóda

Priekopníci tejto metódy sú WALTER GILBERT (nar. 1932) a jeho študent ALLAN MAXAM (nar. 1942). Princípom metódy je rádioaktívne označenie molekuly DNA na 5'-konci a jej následná chemická modifikácia, ktorá je špecifická pre jednotlivé bázy. Následne sa v týchto modifikovaných miestach DNA chemicky štiepi, čím vzniknú rôzne dlhé fragmenty. Dodržiavajú sa pritom také podmienky, aby sa každá molekula DNA štiepila v priemere len na jednom mieste. Z každej molekuly DNA teda vzniknú 2 fragmenty: prvý je na 5'-konci rádioaktívne značený a na 3'-konci zakončený definovaným nukleotidom (podľa spôsobu použitej chemickej modifikácie), druhý fragment, keďže nie je rádioaktívne značený, nebude po autorádiografickej vizualizácii vôbec viditeľný a nebude prekážať sekvenačnej analýze.

Purínové bázy (A, G) sa modifikujú dimetylsulfátom. Ak sa reakcia robí v prítomnosti kyseliny mravčej, sú modifikované oba purínové nukleotidy (A+G), bez jej prítomnosti reaguje len guanín. Modifikácia pyrimidínov (C, T) sa robí hydrazínom. Ak sa reakcia robí pri vysokej koncentrácii NaCl, modifikovaný je len cytozín, pri nízkej koncentrácii soli reagujú obe pyrimidínové bázy (C+T).

Jednotlivé zmesi modifikovej DNA sa opracujú piperidínom, a za týchto podmienok sa molekuly štiepia v mieste modifikácie. V každej skúmavke tak vznikne populácia DNA fragmentov s rôznou dĺžkou, ktoré sú však zakončené rovnakým nukleotidom alebo jedným z dvoch možných v prípade A+G a C+T.

Tab. Chemické modifikácie
A + Gdimetylsulfát + kys.mravčia + piperidín
Gdimetylsulfát + piperidín
C + Thydrazín + NaCl + piperidín
Chydrazín + 1,5 M NaCl + piperidín

Poštiepená DNA sa separuje elektroforeticky na polyakrylamidovom géli a vizualizuje autorádiograficky (podobne ako pri Southernovej hybridizácii). Kapacita reakcie v rámci jedného pracovného cyklu a následná elektroforéza umožňuje čítanie nukleotidovej sekvencie o dĺžke 200-300 nukleotidov.

Enzymatická metóda

Objaviteľom enzymatickej metódy sekvenovania DNA je FREDERICK SANGER (1918-2013). Spolu s Gilbertom dostali Nobelovu cenu za chémiu v r. 1980. Sangerova metóda je známa aj pod názvom "dideoxy sekvenovanie", pretože využíva modifikované nukleotidy - dideoxy-nukleotidy (2',3'-dideoxyribonukleozidtrifosfáty), skrátene ddNTP. Tie sa od štandardných deoxy-nukleotidov (2'-deoxyribonukleozidtrifosfátov, skrátene dNTP) odlišujú tým, že sa môžu pripojiť do novovznikajúceho vlákna DNA na základe párovania báz (pretože majú funkčný 5'-koniec), ale po ich zabudovaní do DNA sa rast reťazca zastaví (nie je prítomný funkčný 3'-koniec).

Klasický postup Sangerovej metódy spočíva v syntéze protiľahlého reťazca DNA využitím rádioaktívne značeného primeru. Reakcia prebieha v štyroch skúmavkách, z ktorých v každej sa nachádzajú všetky štyri deoxy-nukleotidy (dNTP), ale pre každú skúmavku je špecifický malý prídavok určitého ddNTP (ddATP, ddCTP, ddTTP a ddGTP). Malé množstvo týchto dideoxy-nukleotidov spôsobí, že dochádza v prvom rade k začleňovaniu štandardných dNTP a len výnimočne ddNTP, ktorými sa zastavuje syntéza DNA reťazca. V konečnom dôsledku vznikne v každej skúmavke populácia rôzne veľkých DNA fragmentov zakončených konkrétnym ddNTP. Tieto fragmenty sa elektroforeticky separujú na polyakrylamidovom géli a vyhodnocujú podobne ako v prípade chemickej metódy sekvenovania DNA.

Neskoršie modifikácie Sangerovej enzymatickej metódy sekvenovania zahŕňajú predovšetkým nerádioaktívne (fluorescenčné) značenie DNA, a to buď primerov alebo jednotlivých ddNTP. Pri použití štyroch rôznych fluorofórov (jeden zvlášť pre každý typ ddNTP) sa môžu DNA fragmenty všetkých štyroch reakcií elektroforeticky separovať v spoločnej dráhe, pričom sa zo sekvenovania stáva rutinná záležitosť pod kontrolou počítačového softvéru automatických sekvenátorov.

Automatické sekvenátory

Významným pokrokom pri rozvoji sekvenačných metód bolo zavedenie automatických sekvenátorov. Sú to prístroje na elektroforetickú separáciu a detekciu fragmentov DNA vznikajúcich Sangerovou metódou.

Prvé sekvenátory obsahovali klasický vertikálny polyakrylamidový gél, vzorky po rozdelení prechádzali v spodnej časti gélu detektorom, kde boli osvietené laserom a zaznamenala sa fluorescencia jednotlivých DNA fragmentov. Pri použití jednej fluorescenčnej značky pre všetky nukleotidy bolo potrebné separovať vzorky pre každý nukleotid v samostatných dráhach. Podstatným krokom k zjednodušeniu a zefektívneniu tejto technológie bolo zavedenie fluorescenčného značenia jednotlivých ddNTP, kedy každý typ ddNTP bol označený inou fluorescenčnou farbičkou, čo umožnilo spojiť do jednej skúmavky všetky štyri čiastkové sekvenačné reakcie.

Najnovšie automatické sekvenátory využívajú namiesto PAGE elektroforézu v tenkých kapilárach v lineárnych (tekutých) polyméroch, čím sa výrazne zvyšuje kapacita a zároveň sa znižujú požiadavky na technickú zručnosť ich obsluhy. Detekcia fluorescencie farbičiek prebieha po ich excitácii laserovým žiarením, následným zosnímaním emitovaného žiarenia kamerou a softvérovým spracovaním elektroforetogramu. Separácia fragmentov kapilárnou elektroforézou v lineárnych polyméroch umožňuje dosiahnuť čítanie nukleotidovej sekvencie o dĺžke 500-1200 nukleotidov v rámci jedného pracovného cyklu.

Osekvenované genómy

Tab. Príklady najznámejších organizmov s osekvenovaným genómom
organizmus *1poznámkaveľkosť genómu *2počet génov *3
VIRA *4
bakteriofág λ (lambda) *5dsDNA48 502 nt~28 prot. (65 génov *6)
bakteriofág M13 *7ssDNA6 407 nt-
bakteriofág Mu *8dsDNA36 717 nt~28 prot.
bakteriofág P1 *9dsDNA93 601 nt>117 génov
bakteriofág T4 *10dsDNA168 903 nt300 génov
bakteriofág T7 *11dsDNA39 937 nt30 prot.
HAdV-A sérotyp 12adenovirus A, dsDNA34 125 nt29 prot.
HBV (kmeň:ayr)hepatitída B, retrovirus3 215 nt7 prot.
HIV-1retrovirus9 181 nt9 prot.
HIV-2 (izolát:BEN)retrovirus10 359 nt9 prot.
HPV typ 1apapilomavirus, dsDNA7 815 nt7 prot.
HSV-1 (kmeň:17)herpes virus, dsDNA152 261 nt77 prot.
RSVRousov sarkóm, retrovirus9 392 nt4 prot.
SIV (izolát:677)HIV opíc, retrovirus9 623 nt6 prot.
Vírus ovčích kiahnívaricella, dsDNA194 711 nt223 prot.
Vírus pravých kiahní (India-1967)variola, dsDNA185 578 nt197 prot.
Vírus tabakovej mozaikyssDNA, 2 segm.5 085 nt7 prot.
PROKARYOTA *12
Agrobacterium tumefaciens C58rast. parazit a vektor2 841 581 bp2 722
Bacillus anthracis Amespôvodca antraxu5 227 293 bp5 311
Bacillus subtilis 168model, nie je patogén4 214 630 bp4 106
Bordetella pertussis Tohamalčierny kašeľ4 086 189 bp3 806
Borrelia burgdorferi B31lymská borelióza910 724 bp850
Clostridium tetani E88tetanus2 799 251 bp2 373
Corynebacterium diphtheriae NCTC13129záškrt2 488 635 bp2 320
Escherichia coli K-12štand.kmeň E. coli4 639 675 bp4 331
Helicobacter pylori 26695pôvodca žal.vredov1 667 867 bp1 566
Lactobacillus acidophilus NCFMzložka mlieka1 993 564 bp1 864
Mycobacterium tuberculosis CDC1551pôvodca tuberkulózy4 403 837 bp4 189
Mycoplasma genitalum G37najmenší prok. genóm580 076 bp476
Pseudomonas aeruginosa PAO1nozokomiálne infekcie6 264 403 bp5 566
Rhizobium leguminosarum viciae3841nitrifikačná baktéria7 751 309 bp4 746
Salmonella typhimurium LT2pôvodca salmonelózy4 857 432 bp4 452
Staphylococcus aureus COLnozokomiálne infekcie2 809 422 bp2 673
Treponema pallidum Nicholssyfilis1 138 011 bp1 031
Vibrio cholerae N16961cholera2 961 149 bp2 736
Yersinia pestis Antiquaľudský mor4 702 289 bp4 167
EUKARYOTA *13
Entamoeba histolyticadyzentéria23,8 Mbp9 938
Chlamydomonas reinhardtiizelená riasa, model *14121 Mbp15 400
Paramecium tetraureliačrievička, model72 Mbp39 642
Plasmodium falciparummalária23,1 Mbp5 878
Tetrahymena termophilariasničkavce, model104 Mbp27 000
Trypanosoma bruceispavá choroba26 Mbp9 068
Aspergillus nidulansmodel30 Mbp9 500
Kluyveromyces lactiskvasinka, model10-12 Mbp5 329
Neurospora crassapleseň, model40 Mbp10 082
Saccharomyces cerevisiae S288C1. osekv. euk., model12,1 Mbp6 294
Schizosaccharomyces pombe 972hkvasinka, model14 Mbp4 824
Arabidopsis thalianakapustovité, model120 Mbp25 498
Oryza sativa ssp. japonicaryža, model466 Mbp46 022-55 615
Vitis vinifera PN40024vinič490 Mbp30 434
Apis melliferavčela medonosná1,8 Gbp10 157
Bombyx moripriadka morušová530 Mbp-
Caenorhabditis elegans Bristol N2červ, model97 Mbp19 000
Drosophila melanogastermucha, model165 Mbp13 600
Gallus gallus f. domestica *15kur domáci, model1,0 Gbp20-23 000
Takifugu rubripesryba, najm. genóm stavovcov390 Mbp22-29 000
Bos primigenius f. taurus *15krava3,0 Gbp-
Canis lupus f. familiaris *15pes domáci2,4 Gbp19 300
Cavia aperea f. porcellus *15morča3,4 Gbp-
Equus przewalskii f. caballus *15kôň2,1 Gbp-
Felis lybica f. catus *15mačka domáca3,0 Gbp20 285
Homo sapiensčlovek3,2 Gbp25 000
Mus musculus var. alba *15myš, laboratórna2,5 Gbp24 174
Pan troglodytesšimpanz3,1 Gbp-
Rattus norvegicus var. alba *15potkan, laboratórny2,8 Gbp21 166

Vysvetlivky:
*1 - u vírusov konkrétny typ/sérotyp/kmeň/izolát, ktorý bol osekvenovaný; druhový názov u prokaryot a niektorých eukaryot doplnený označením kmeňa (príp. odrody u rastlín)
*2 - u vírusov udávaná v nukleotidoch (nt), pri tomto údaji nerozhoduje, či sa jedná o dvoj- alebo jednovláknovú NK (uvedené v poznámkach); veľkosť genómu prokaryot a eukaryot udávaná v bp (bázových pároch), Mbp (1 000 000 bp) alebo Gbp (1 000 000 000 bp)
*3 - vírusy nemajú gény pre syntézu rRNA a tRNA, tak de facto je počet génov rovný počtu syntetizovaných proteínov (tento údaj o počte proteínov potom ale nezahŕňa prípadnú syntézu ostatných funkčných NK - napr. antisense RNA); u eukaryot je údaj o počte génov len približný!
*4 - zdroj: Entrez Genomes, Viral Genomes Resource
*5 - zdroj: Wikipedia, Lambda phage
*6 - spočítané všetky gény a orf neznámej funkcie z http://www.mun.ca/biochem/courses/4103/topics/Lambda/Lambda_overview.html
*7 - Simons, G.F.M., Konings, R.N.H., and Schoenmakers, J.G.G. (1981). Genes VI, VII, and IX of phage M13 code for minor capsid proteins of the virion. PNAS vol. 78, pp. 4194-4198.
*8 - Morgan, G.J., Hatfull, G.F., Casjens, S., and Hendrix, R.W. (2002). Bacteriophage Mu genome sequence: analysis and comparison with Mu-like prophages in Haemophilus, Neisseria and Deinococcus. Journal of Molecular Biology 317(3):337-59.
*9 - Lobocka, M.B., Rose, D.J., Plunkett, a kol. (2004). Genome of Bacteriophage P1. Journal of Bacteriology, vol. 186, no. 21, p. 7032-7068.
*10 - Miller, E.S., Kutter, E., Mosig, G., a kol. (2003). Bacteriophage T4 Genome. Microbiology and Molecular Biology Reviews, vol. 67, no. 1, p. 86-156.
*11 - Chan, L.Y., Kosuri, S., and Endy, D. (2005). Refactoring bacteriophage T7. Molecular Systems Biology 1 Article number: 2005.0018, doi:10.1038/msb4100025.
*12 - zdroj: Wikipedia, List of sequenced prokaryotic genomes (referencie uvedené tam)
*13 - zdroj: Wikipedia, List of sequenced eukaryotic genomes (referencie uvedené tam)
*14 - zdroj: Sandwalk: The Genome of Chlamydomonas reinhardtii
*15 - Gaisler, J., Zima, J.: Zoologie obratlovců. 2. prepracované vydanie, Academia, Praha 2007, 694 s., ISBN 978-80-200-1484-9.