Chí-kvadrát test

Informácie získané z genetického kríženia sú kvantitatívneho charakteru. V genetických experimentoch, ktorých výsledkom býva zistenie početnosti rôznych tried, resp. frekvencia štiepnych pomerov, treba rozhodnúť, či zistené frekvencie zodpovedajú teoreticky očakávaným frekvenciám. Χ2-test nám pomáha pomocou testovateľnej hypotézy porozumieť odchýlkam, ktoré v experimente vznikli.

Vzorec na výpočet Χ2 hodnoty:

Χ2 = n

i=1
(e - t)2
t

n = celkový počet fenotypových tried,
e = experimentálna frekvencia i-tej triedy,
t = teoretická frekvencia i-tej triedy

Označenie Χ2 sa vyslovuje ako "chí kvadrát" a nie ako "chí na druhú", výslednú hodnotu sa nepokúšajte odmocniť! Vzorec pochopíte viac z vyriešených vzorových príkladov.
 
 
 

Nulová hypotéza

V tomto štatistickom teste vyslovujeme záver o zhode alebo rozdiele medzi experimentálne získanými a teoreticky očakávanými štiepnymi pomermi na základe testovania nulovej hypotézy. Nulová hypotéza (H0) je predpoklad, že neexistuje rozdiel medzi očakávanými a teoretickými výsledkami (H0 = e - t = 0). Na základe výsledkov Χ2-testu nulovú hypotézu:

  1. prijímame - rozdiely medzi experimentálnymi a očakávanými hodnotami vznikli len vplyvom náhody
  2. zamietame - rozdiely sú štatisticky významné (treba zvoliť inú hypotézu)

Nami zvolená hypotéza musí byť testovateľná. Ako príklad môže slúžiť hod mincou. Ak je hod mincou náhodný a spravodlivý, tak teoreticky polovica hodov bude "hlava" a polovica "znak". Hypotézu hody nie sú náhodné (t.j. uprednostňuje sa určitá hodnota) nemôžeme testovať, pretože existuje nekonečný počet spôsobov ako môžu byť hody neobjektívne. Naopak hypotéza hody sú náhodné je testovateľná, pretože vieme, že 50% teoretických hodov bude "hláv" a 50% hodov bude "znakov" a výsledný pomer bude 1 : 1. Podobná situácia platí aj v prípadoch, keď chceme testovať väzbu génov alebo mendelistické štiepne pomery. Ak chceme testovať génovú väzbu, musíme testovať hypotézu, že gény nie sú vo väzbe, pretože v tom prípade sú teoretické fenotypové pomery pre voľnú kombinovateľnosť 50% (AB a Ab) k 50% (aB a ab) testovateľné oproti neznámym pomerom, ak sú gény vo väzbe.

Tab. Hodnoty Χ2
DFP
0,0010,010,050,10,20,50,90,951
110,836,643,842,711,640,460,020,000,00
213,829,215,994,603,221,390,210,100,02
316,2711,347,826,254,642,370,580,350,12
418,4713,289,497,785,993,361,060,710,30
520,5215,0911,079,247,294,351,611,140,55
622,4616,8112,5910,648,565,352,201,640,87
724,3218,4814,0712,029,806,352,832,171,24
826,1320,0915,5113,3611,037,343,492,731,65
927,8821,7616,9214,6812,248,344,173,322,09
1029,5923,2118,3115,9913,449,344,863,942,56
1131,2624,7219,6817,2814,6310,345,584,583,05
1232,9126,2221,0318,5515,8111,346,305,233,57
1334,5327,6922,3619,8116,9812,347,045,894,11
1436,1229,1423,6821,0618,1513,347,796,574,66
1537,7030,5825,0022,3119,3114,348,557,265,23
2045,3237,5731,4128,4125,0419,3412,4410,858,26
2552,6244,3137,6534,3830,6824,3416,4714,4111,52
3059,7050,8943,7740,2636,2529,3420,6018,4914,95
5086,6676,1567,5163,1758,1649,3437,6934,76?

Stupne voľnosti (DF)

V tabuľke sa nachádzajú rôzne hodnoty Χ2, ktoré sú zoradené do riadkov podľa stupňov voľnosti (DF) (angl. degrees of freedom). Stupne voľnosti predstavujú počet kategórií zmenšený o 1 (napr. ak je počet fenotypových tried rovný 4, počet stupňov voľnosti bude 4 - 1 = 3).

Pravdepodobnosť (P)

P je pravdepodobnosť, že odchýlka pozorovaných hodnôt od očakávaných vznikla v dôsledku náhody (napr. nešťastného výberu testovanej vzorky) a nie je štatisticky významná. Napríklad hodnota Χ2 = 3,43 pre 3 stupne voľnosti sa nachádza medzi P = 0,30 a 0,50. To znamená, že v 30-50 prípadoch zo 100 nezávislých opakovaní experimentu vzniknú nezrovnalosti medzi teoretickými a získanými hodnotami pri nami zvolenej hypotéze LEN v dôsledku náhody.

P zároveň znamená aj pravdepodobnosť, s akou sa dopustíme chyby, keď zamietneme nulovú hypotézu a ona je v skutočnosti pravdivá. Napríklad, keď máme počet stupňov voľnosti 3 a vypočítaná Χ2-hodnota je 0,5, v prípade, že zamietneme nulovú hypotézu (predpokladáme, že odchýlky medzi nameranými a teoretickými hodnotami nevznikli LEN vplyvom náhody), dopúšťame sa tým 90% chyby, ak je nulová hypotéza pravdivá.

Hladina významnosti

Hladina významnosti predstavuje najnižšiu kritickú hranicu pravdepodobnosti, s akou zamietame nulovú hypotézu. Môžeme, ale nemusíme ju stanoviť pred testovaním našej hypotézy. Ak sa hladina významnosti nestanovuje vopred, pravdepodobnosť pre určitú Χ2-hodnotu sa interpretuje samostatne (pozri vyššie uvedený príklad s Χ2 = 3,43). Ak si za hladinu významnosti zvolíme napr. pravdepodobnosť 20%, prienikom stupňov voľnosti v riadku s pravdepodobnosťou v stĺpci 0,2 (alebo 20%) dostaneme Χ2-hodnotu, pri ktorej už nulovú hypotézu zamietame. To znamená, že ak vypočítaná Χ2-hodnota je rovná alebo vyššia ako Χ2-hodnota v tomto prieniku, nulovú hypotézu zamietame, ak je nižšia, nulovú hypotézu prijímame.

Väčšina autorov uvádza hladinu významnosti P < 0,05 ako štatisticky významný a P < 0,01 ako štatisticky vysoko významný vzťah. To znamená, že ak je hladina významnosti 0,05, pozorované odchýlky môžeme považovať za čisto náhodné len v 5 prípadoch zo 100 (v 95 prípadoch budú odchýlky vzniknuté vplyvom iných činiteľov). Takže, keď nám výjde Χ2-hodnota väčšia ako kritická hodnota, znamená to pri P = 0,05 veľmi vysokú pravdepodobnosť, že odchýlka je štatisticky významná. Teda znížením hladiny významnosti zvyšujeme presvedčenie, že pri vyšších Χ2-hodnotách ako je kritická hodnota nezamietneme pravdivú hypotézu.

Hladina významnosti, hoci je pravdepodobnosť ako každá iná, je významovo veľmi dôležitá, pretože určuje hranicu, kedy výsledok Χ2-testu považujeme za štatisticky významný rozdiel medzi pozorovanými a očakávanými údajmi, ktorý musel vzniknúť aj vplyvom iných činiteľov ako LEN dôsledkom náhody. Preto sa hladina významnosti zvykne označovať α = 0,05 (resp. 0,01 apod.).
 
 
 

Testovanie mendelistických štiepnych pomerov

Pri krížení drozofíl línie N-72 (normálne dlhé krídla, normálna farba tela) s dvojnásobne recesívnou mutantnou líniou hairy brown boli v F2 generácii získané tieto fenotypové štiepne pomery: 80 jedincov normálneho fenotypu, 36 jedincov fenotypu hairy (nadpočetné štetinky), 42 jedincov fenotypu brown (hnedé oči) a 8 jedincov hairy brown. Zistite, či sa tento experimentálny štiepny pomer štatisticky odlišuje od teoreticky očakávaného štiepneho pomeru 9 : 3 : 3 : 1 (nulová hypotéza).

Zostrojíme tabuľku, kde vypočítame Χ2-hodnotu, ktorú potom porovnáme s hodnotou v tabuľke pre hladinu významnosti 5% (0,05):

Tab. Výpočet Χ2-hodnoty pre štiepny pomer 9 : 3 : 3 : 1
triedafenotypideálny
štiepny
pomer
ete-t(e - t)^2 ÷ t
1h+bw+98093,3713,171,91
2hbw+33631,124,880,76
3h+bw34231,1210,883,80
4hbw1810,372,370,54
spolu161661667,01
  1. spočítame všetky jedince z experimentu (80 + 36 + 42 + 8 = 166) a ideálne štiepne pomery (9 + 3 + 3 + 1 = 16)
  2. vypočítame očakávané štiepne pomery vydelením počtu všetkých jedincov so súčtom ideálnych štiepnych pomerov (166 ÷ 16 = 10,37); 9 × 10,37 = 93,37; 3 × 10,37 = 31,12
  3. vypočítame rozdiel experimentálnych a teoretických hodnôt pre každú fenotypovú triedu; pozn.: je v podstate jedno, čo od čoho odčítate, pretože v ďalšom kroku sa tento rozdiel umocní, takže výsledkom bude absolútna hodnota
  4. umocníme vypočítaný rozdiel a vydelíme ho počtom všetkých jedincov: (e - t)2 ÷ t
  5. sčítame všetky hodnoty v poslednom stĺpci tabuľky a výsledkom je jedna Χ2-hodnota, ktorú porovnáme s tabuľkovou hodnotou
  6. počet stupňov voľnosti predstavuje počet tried zmenšený o jednu: 4 - 1 = 3; prienik v riadku DF=3 a hladiny významnosti α=0,05 v tabuľke Χ2-hodnôt (7,82) porovnáme hodnoty

V našom prípade je Χ2 7,01 < Χ20,05 = 7,82, teda pri odchýlkach od štiepneho pomeru 9 : 3 : 3 : 1 môžeme potvrdiť platnosť nulovej hypotézy a zhodu experimentálnych a teoreticky očakávaných štiepnych pomerov. Zistené rozdiely sú iba náhodné a nie sú štatisticky významné.

Týmto spôsobom môžeme testovať akýkoľvek štiepny pomer, vrátane génových interakcií a stanoviť najpravdepodobnejší spôsob dedičnosti daného znaku (znakov).

Testovanie väzby génov

Pomocou Χ2-testu možno na základe testovacieho kríženia jednoducho zistiť, či gény determinujúce určitý znak sú alebo nie sú vo väzbe.

Zvolíme si na to rodičov, z ktorých jeden je heterozygotom pre oba znaky (AaBb) a druhý je recesívnym homozygotom (aabb). V tomto prípade sú možné 4 fenotypové kategórie, ktoré by sa mali vyskytovať v pomere 1 : 1 : 1 : 1 (AB : Ab : aB : ab). Ak je počet jedincov s rodičovským fenotypom (AB a ab) odlišný (vyšší) od počtu jedincov s rekombinantným fenotypom (Ab a aB), gény sú vo väzbe.

Musíme ešte zostaviť vhodnú testovateľnú hypotézu. Ak sú gény vo väzbe, nepoznáme teoretický fenotypový štiepny pomer. Ten je známy len vtedy, ak predpokladáme, že gény nie sú vo väzbe, pretože vtedy na základe voľnej kombinovateľnosti génov A a B získame spomenuté fenotypové kategórie v pomere 1 : 1 : 1 : 1.

Alela b v recesívne homozygotnom stave vedie k čiernemu zafarbeniu tela drozofíl (black) a recesívny homozygot v alele vg má zakrpatené krídla (vestigial). Po krížení heterozygota a recesívneho homozygota v oboch génoch sme v F2 generácii získali nasledovné počty jedincov: 283 jedincov normálneho fenotypu, 1294 jedincov so zakrpatenými krídlami, 1418 jedincov s čiernou farbou tela a 241 jedincov s čiernym telom a zakrpatenými krídlami. Na základe výsledkov z uvedeného testovacieho kríženia zistite, či sú tieto dva gény vo väzbe.

Aj v tomto prípade zostrojíme tabuľku, kde vypočítame Χ2-hodnotu, ktorú potom porovnáme s hodnotou v tabuľke pre hladinu významnosti 5% (0,05). Výpočet sa však robí trochu odlišne ako v prípade štiepnych pomerov. Pri testovaní väzby génov existujú v podstate len 2 fenotypové triedy: parentálne a rekombinantné fenotypy. Tabuľka potom vyzerá nasledovne:

Tab. Výpočet Χ2-hodnoty pre voľnú kombinovateľnosť génov
triedafenotypideálny
štiepny
pomer
ete-t(e - t)^2 ÷ t
1b+vg1124916181094739,7
bvg+1418
2b+vg+12831618-1094739,7
bvg241
spolu2323632361479,4

Postup k výpočtu Χ2-hodnoty je uvedený v predchádzajúcom príklade pri testovaní mendelistických štiepnych pomerov. Keďže sme v podstate testovali, či je pomer rekombinantov a rodičovských fenotypov 1 : 1 (a v takom prípade by sa jednalo o voľnú kombinovateľnosť), existuje len 1 stupeň voľnosti (2 - 1 = 1). Na základe počtov jedincov v jednotlivých fenotypových triedach je zrejmé, že pôvodný heterozygotný rodič má gény vo väzbe vo fáze trans.

Keďže vypočítaná hodnota Χ2 je omnoho vyššia ako hodnota Χ2, ktorá je v prieniku DF=1 a α=0,05 (alebo trebárs aj 0,001), značí to, že v menej ako 1 prípade z 1000 vzniknú odchýlky od očakávaných štiepnych pomerov LEN v dôsledku náhody. Znamená to, že vzniknuté odchýlky sú štatisticky natoľko významné, že nulovú hypotézu musíme zamietnuť. Zamietnutím hypotézy gény nie sú vo väzbe je jedinou logickou alternatívou, že gény sú vo väzbe. Odchýlky od očakávaných štiepnych pomerov tak vznikli v experimente v dôsledku toho, že gény sú vo väzbe a nevzniká ekvivalentný počet rodičovských a rekombinantných fenotypov.