Chí-kvadrát test

Autor:
Publikované dňa:

Citácia: PANČÍK, Peter. 2016. Biopedia.sk: Chí-kvadrát test. [cit. 2024-03-29]. Dostupné na internete: <https://biopedia.sk/genetika/chi-kvadrat-test>.

Informácie získané z genetického kríženia sú kvantitatívneho charakteru. V genetických experimentoch, ktorých výsledkom býva zistenie početnosti rôznych tried, resp. frekvencia štiepnych pomerov, treba rozhodnúť, či zistené frekvencie zodpovedajú teoreticky očakávaným frekvenciám. Χ2-test nám pomáha pomocou testovateľnej hypotézy porozumieť odchýlkam, ktoré v experimente vznikli.

Vzorec na výpočet Χ2 hodnoty:

Χ2=n

i=1
(e - t)2
t

n = celkový počet fenotypových tried,
e = experimentálna frekvencia i-tej triedy,
t = teoretická frekvencia i-tej triedy

Označenie Χ2 sa vyslovuje ako "chí kvadrát" a nie ako "chí na druhú", výslednú hodnotu sa nepokúšajte odmocniť! Vzorec pochopíte viac z vyriešených vzorových príkladov.

Nulová hypotéza link

V tomto štatistickom teste vyslovujeme záver o zhode alebo rozdiele medzi experimentálne získanými a teoreticky očakávanými štiepnymi pomermi na základe testovania nulovej hypotézy. Nulová hypotéza (H0) je predpoklad, že neexistuje rozdiel medzi očakávanými a teoretickými výsledkami (H0 = e - t = 0). Na základe výsledkov Χ2-testu nulovú hypotézu:

  1. prijímame - rozdiely medzi experimentálnymi a očakávanými hodnotami vznikli len vplyvom náhody, resp. nešťastne zvolenej vzorky
  2. zamietame - rozdiely sú štatisticky významné (treba zvoliť inú hypotézu)

Nami zvolená hypotéza musí byť testovateľná. Ako príklad môže slúžiť hod mincou. Ak je hod mincou náhodný a spravodlivý, tak teoreticky polovica hodov bude "hlava" a polovica "znak". Hypotézu "hody nie sú náhodné" (t.j. uprednostňuje sa určitá hodnota) nemôžeme testovať, pretože existuje nekonečný počet spôsobov ako môžu byť hody neobjektívne. Naopak hypotéza "hody sú náhodné" je testovateľná, pretože vieme, že 50% teoretických hodov bude "hlava" a 50% hodov bude "znak" a výsledný pomer bude 1 : 1. To isté platí aj v prípadoch, keď chceme testovať mendelistické štiepne pomery, resp. génové väzby.

Alternatívna hypotéza link

Alternatívna hypotéza (H1) je opakom (negáciou) nulovej hypotézy. Alternatívnu hypotézu netestujeme, ale platí automaticky v prípade, že sme nulovú hypotézu zamietli. Protikladom k nulovej hypotéze "gény nie sú vo väzbe" je alternatívna hypotéza "gény sú vo väzbe".

DFP
0,0010,010,050,10,20,50,90,951
110,836,643,842,711,640,460,020,000,00
213,829,215,994,603,221,390,210,100,02
316,2711,347,826,254,642,370,580,350,12
418,4713,289,497,785,993,361,060,710,30
520,5215,0911,079,247,294,351,611,140,55
622,4616,8112,5910,648,565,352,201,640,87
724,3218,4814,0712,029,806,352,832,171,24
826,1320,0915,5113,3611,037,343,492,731,65
927,8821,7616,9214,6812,248,344,173,322,09
1029,5923,2118,3115,9913,449,344,863,942,56
1131,2624,7219,6817,2814,6310,345,584,583,05
1232,9126,2221,0318,5515,8111,346,305,233,57
1334,5327,6922,3619,8116,9812,347,045,894,11
1436,1229,1423,6821,0618,1513,347,796,574,66
1537,7030,5825,0022,3119,3114,348,557,265,23
2045,3237,5731,4128,4125,0419,3412,4410,858,26
2552,6244,3137,6534,3830,6824,3416,4714,4111,52
3059,7050,8943,7740,2636,2529,3420,6018,4914,95
5086,6676,1567,5163,1758,1649,3437,6934,76?
Tab. Hodnoty Χ2

Stupne voľnosti (DF) link

V tabuľke sa nachádzajú rôzne hodnoty Χ2, ktoré sú zoradené do riadkov podľa stupňov voľnosti (DF) (angl. degrees of freedom). Stupne voľnosti predstavujú počet kategórií zmenšený o 1 (napr. ak je počet fenotypových tried rovný 4, počet stupňov voľnosti bude 4 - 1 = 3).

Pravdepodobnosť (P) link

P je pravdepodobnosť, že odchýlka pozorovaných hodnôt od očakávaných vznikla v dôsledku náhody (napr. nešťastného výberu testovanej vzorky) a nie je štatisticky významná. Napríklad hodnota Χ2 = 3,43 pre 3 stupne voľnosti sa nachádza medzi P = 0,20 a 0,50. To znamená, že v 20-50 prípadoch zo 100 nezávislých opakovaní experimentu vzniknú nezrovnalosti medzi teoretickými a získanými hodnotami pri nami zvolenej hypotéze LEN v dôsledku náhody.

P zároveň znamená aj pravdepodobnosť, s akou sa dopustíme chyby, keď zamietneme nulovú hypotézu a ona je v skutočnosti pravdivá. Napríklad, keď máme počet stupňov voľnosti 3 a vypočítaná Χ2-hodnota je 0,5, v prípade, že zamietneme nulovú hypotézu (predpokladáme, že odchýlky medzi nameranými a teoretickými hodnotami nevznikli LEN vplyvom náhody), dopúšťame sa tým 90% chyby, ak je nulová hypotéza pravdivá.

Hladina významnosti (α) link

Hladina významnosti predstavuje najnižšiu kritickú hranicu pravdepodobnosti, s akou zamietame nulovú hypotézu. Môžeme, ale nemusíme ju stanoviť pred testovaním našej hypotézy (v tom prípade len interpretujeme, aká pravdepodobnosť prislúcha nášmu výsledku Χ2). Ak si za hladinu významnosti zvolíme napr. pravdepodobnosť 20%, prienikom stupňov voľnosti v riadku s pravdepodobnosťou v stĺpci 0,2 (alebo 20%) dostaneme Χ2-hodnotu, pri ktorej už nulovú hypotézu zamietame. To znamená, že ak vypočítaná Χ2-hodnota je rovná alebo vyššia ako Χ2-hodnota v tomto prieniku, nulovú hypotézu zamietame, ak je nižšia, nulovú hypotézu prijímame.

Väčšina autorov uvádza hladinu významnosti α = 0,05 ako štatisticky významný a α = 0,01 ako štatisticky vysoko významný vzťah. To znamená, že ak je hladina významnosti 0,05, pozorované odchýlky môžeme považovať za čisto náhodné len v 5 prípadoch zo 100 (v 95 prípadoch budú odchýlky vzniknuté vplyvom iných činiteľov). Takže, keď nám výjde Χ2-hodnota väčšia ako kritická hodnota, znamená to pri P = 0,05 veľmi vysokú pravdepodobnosť, že odchýlka je štatisticky významná. Teda znížením hladiny významnosti zvyšujeme presvedčenie, že pri vyšších Χ2-hodnotách ako je kritická hodnota nezamietneme pravdivú hypotézu.

Testovanie mendelistických štiepnych pomerov link

Pri krížení drozofíl línie N-72 (normálne dlhé krídla, normálna farba tela) s dvojnásobne recesívnou mutantnou líniou hairy brown boli získané tieto fenotypové štiepne pomery: 80 jedincov normálneho fenotypu (h+bw+), 36 jedincov fenotypu hairy (nadpočetné štetinky; hbw+), 42 jedincov fenotypu brown (hnedé oči; h+bw) a 8 jedincov hairy brown (hbw). Zistite, či sa tento experimentálny štiepny pomer štatisticky odlišuje od teoreticky očakávaného štiepneho pomeru 9 : 3 : 3 : 1 (nulová hypotéza).

Zostrojíme tabuľku, kde vypočítame Χ2-hodnotu, ktorú potom porovnáme s hodnotou v tabuľke pre hladinu významnosti 5% (0,05):

triedafenotypideálny štiepny pomerete-t(e - t)2 ÷ t
1h+bw+98093,3713,171,91
2hbw+33631,124,880,76
3h+bw34231,1210,883,80
4hbw1810,372,370,54
spolu161661667,01
Tab. Výpočet Χ2-hodnoty pre štiepny pomer 9 : 3 : 3 : 1
  1. spočítame všetky jedince z experimentu (80 + 36 + 42 + 8 = 166) a ideálne štiepne pomery (9 + 3 + 3 + 1 = 16)
  2. vypočítame očakávané štiepne pomery vydelením počtu všetkých jedincov so súčtom ideálnych štiepnych pomerov (166 ÷ 16 = 10,37); 9 × 10,37 = 93,37; 3 × 10,37 = 31,12
  3. vypočítame rozdiel experimentálnych a teoretických hodnôt pre každú fenotypovú triedu; pozn.: je v podstate jedno, čo od čoho odčítate, pretože v ďalšom kroku sa tento rozdiel umocní, takže výsledkom bude absolútna hodnota
  4. umocníme vypočítaný rozdiel a vydelíme ho počtom všetkých jedincov: (e - t)2 ÷ t
  5. sčítame všetky hodnoty v poslednom stĺpci tabuľky a výsledkom je jedna Χ2-hodnota, ktorú porovnáme s tabuľkovou hodnotou
  6. počet stupňov voľnosti predstavuje počet tried zmenšený o jednu: 4 - 1 = 3; prienik v riadku DF=3 a hladiny významnosti α=0,05 v tabuľke Χ2-hodnôt (7,82) porovnáme hodnoty

V našom prípade je Χ2 7,01 < Χ20,05 = 7,82, teda pri odchýlkach od štiepneho pomeru 9 : 3 : 3 : 1 môžeme potvrdiť platnosť nulovej hypotézy a zhodu experimentálnych a teoreticky očakávaných štiepnych pomerov. Zistené rozdiely sú iba náhodné a nie sú štatisticky významné.

Týmto spôsobom môžeme testovať akýkoľvek štiepny pomer, vrátane génových interakcií a stanoviť najpravdepodobnejší spôsob dedičnosti daného znaku (znakov).

Testovanie väzby génov link

Pomocou Χ2-testu možno na základe testovacieho kríženia jednoducho zistiť, či gény determinujúce určitý znak sú alebo nie sú vo väzbe, a dokonca v akej fáze (cis alebo trans) sa v prípade väzby nachádzajú vo väzbovej skupine.

Zvolíme si na to rodičov, z ktorých jeden je heterozygotom pre oba znaky (AaBb) a druhý je recesívnym homozygotom (aabb). V tomto prípade sú možné 4 genotypové kategórie, ktoré by sa mali vyskytovať v rovnakom pomere. Na základe mendelistického kríženia by sme mali očakávať, že všetky 4 možné genotypy vzniknú s 25% pravdepodobnosťou.

Ak by však gény AB (fáza cis) tvorili jednu väzbovú skupinu, preferovalo by to u heterozygotného rodiča výskyt gamét AB a ab na úkor rekombinantných aB a Ab, čo by sa prejavilo aj v vyššom počte potomkov nesúcich takúto kombináciu génov. Ak by však naopak bolo viac potomkov s kombináciou aB alebo Ab, znamenalo by to, že gény vo väzbovej skupine heterozygotného rodiča sú vo fáze trans.

Ešte jednoduchšie je si celú situáciu predstaviť v prípade, ak sú alely vo vzťahu úplnej dominancie. Ak sú gény vo väzbe, počet jedincov s rodičovským fenotypom (A+B+, aabb) sa bude odlišovať od rekombinantov (A+bb, aaB+). Z hľadiska toho, či existuje alebo neexistuje medzi dvomi génmi väzba, nás preto zaujímajú len uvedené 2 fenotypové triedy: parentálne a rekombinantné fenotypy.

Ak sú gény voľne kombinovateľné, výskyt parentálnych a rekombinantných fenotypov bude v pomere 1 : 1. Ak sú gény vo väzbe, u potomstva bude preferovaný výskyt buď jedného alebo druhého fenotypu. S tým súvisí aj princíp, ako zostaviť vhodnú testovateľnú nulovú hypotézu. Ak sú gény vo väzbe, nepoznáme teoretický fenotypový štiepny pomer. Ten je známy len vtedy, ak predpokladáme, že gény nie sú vo väzbe, pretože vtedy na základe voľnej kombinovateľnosti génov A a B získame spomenuté fenotypové kategórie v pomere 1 : 1. Vždy teda testujeme nulovú hypotézu "gény nie sú väzbe".

Alela b v recesívne homozygotnom stave vedie k čiernemu zafarbeniu tela drozofíl (black) a recesívny homozygot v alele vg má zakrpatené krídla (vestigial). Po krížení heterozygota a recesívneho homozygota v oboch génoch sme získali nasledovné počty jedincov: 283 jedincov normálneho fenotypu (b+vg+), 1294 jedincov so zakrpatenými krídlami (b+vg), 1418 jedincov s čiernou farbou tela (bvg+) a 241 jedincov s čiernym telom a zakrpatenými krídlami (bvg). Na základe výsledkov z uvedeného testovacieho kríženia zistite, či sú tieto dva gény vo väzbe.

triedafenotypideálny štiepny pomerete-t(e - t)2 ÷ t
1b+vg1124916181094739,7
bvg+1418
2b+vg+12831618-1094739,7
bvg241
spolu2323632361479,4
Tab. Výpočet Χ2-hodnoty pre voľnú kombinovateľnosť génov

Postup k výpočtu Χ2-hodnoty je uvedený v predchádzajúcom príklade pri testovaní mendelistických štiepnych pomerov. Keďže sme v podstate testovali, či je pomer rekombinantov a rodičovských fenotypov 1 : 1 (a v takom prípade by sa jednalo o voľnú kombinovateľnosť), existuje len 1 stupeň voľnosti (2 - 1 = 1). Na základe počtov jedincov v jednotlivých fenotypových triedach je zrejmé, že pôvodný heterozygotný rodič má gény vo väzbe vo fáze trans.

Keďže vypočítaná hodnota Χ2 je omnoho vyššia ako hodnota Χ2, ktorá je v prieniku DF=1 a α=0,05 (alebo trebárs aj 0,001), značí to, že v menej ako 1 prípade z 1000 vzniknú odchýlky od očakávaných štiepnych pomerov LEN v dôsledku náhody. Znamená to, že vzniknuté odchýlky sú štatisticky natoľko významné, že nulovú hypotézu musíme zamietnuť. Zamietnutím hypotézy gény nie sú vo väzbe je jedinou logickou alternatívou, že gény sú vo väzbe. Odchýlky od očakávaných štiepnych pomerov tak vznikli v experimente v dôsledku toho, že gény sú vo väzbe a nevzniká ekvivalentný počet rodičovských a rekombinantných fenotypov.

Ďalšie články

Väzba génov

Gény, ktoré sa nachádzajú na jednom chromozóme, tvoria tzv. väzbovú skupinu. To znamená, že pri krížení nie je pravdepodobnosť vzniku tzv. rekombinantného fenotypu náhodná, ale úmerne závisí od vzdialenosti génov od seba. Pravdepodobnosť, že dôjde k rekombinácii medzi génmi nachádzajúcimi sa na jednom chromozóme je tým menšia, čím je táto vzdialenosť menšia. Pre takéto gény preto neplatí mendelistická dedičnosť.

Mimojadrová dedičnosť

Mimojadrová (extrachromozomálna) dedičnosť je dedičnosť viazaná na semiautonómne bunkové organely, ktoré majú vlastnú DNA. Patria sem mitochondrie a u rastlín aj chloroplasty. Tieto organely sú prokaryotického pôvodu, takže ich genetickú informáciu tvorí dvojreťazcová, väčšinou kruhová molekula DNA, ktorá sa v každej organele nachádza v mnohých kópiách. Keďže spermie neobsahujú prakticky žiadnu cytoplazmu, po oplodnení je výsledný fenotyp daný fenotypom samičieho jedinca. S mitochondriálnou DNA súvisia aj niektoré genetické ochorenia ľudí.

Genetika prokaryot

Prokaryotické organizmy nemožno geneticky študovať tak ako eukaryotické predovšetkým z toho dôvodu, že majú len jeden chromozóm a sú teda neustále v kvázi monoploidnom stave. Môžeme však u nich študovať javy, kedy si genetickú informáciu vymieňajú, resp. ju prijímajú, a na základe toho určovať dominanciu/recesivitu alel alebo mapovať gény na DNA. Týmito javmi sú konjugácia, transdukcia a transformácia.

forward