Obsah
- Typ požadovaných údajov
- Test dobrej zhody
- Vypočítava sa štatistika Chi-Square
- Interpretácia Chi-Square štatistiky
Experimenty testujú predpovede. Tieto predpovede sú často číselné, čo znamená, že keď vedci zhromažďujú údaje, očakávajú, že sa ich čísla určitým spôsobom rozdelia. Údaje zo skutočného sveta zriedka zodpovedajú presne predpovedi, ktorú vedci robia, takže vedci potrebujú test, aby im povedali, či je rozdiel medzi pozorovanými a očakávanými číslami náhodnou náhodou alebo nejakým nepredvídaným faktorom, ktorý núti vedca upravovať základnú teóriu. , Test chí-kvadrát je štatistický nástroj, ktorý vedci používajú na tento účel.
Typ požadovaných údajov
Na použitie testu chí-kvadrát potrebujete kategorické údaje. Príkladom kategorických údajov je počet ľudí, ktorí odpovedali na otázku „áno“ v porovnaní s počtom ľudí, ktorí odpovedali na otázku „nie“ (dve kategórie), alebo počet žab v populácii zelenej, žltej alebo šedej ( tri kategórie). Nemôžete použiť test chí-kvadrát na nepretržité údaje, ako napríklad tie, ktoré sa dajú získať z prieskumu, ktorý sa pýta ľudí, aké sú vysoké. Z tohto prieskumu by ste získali širokú škálu výšok. Ak ste však rozdelili výšky do kategórií, ako napríklad „do 6 stôp vysoký“ a „do 6 stôp vysoký a viac“, potom by ste mohli na údajoch použiť test chí-kvadrát.
Test dobrej zhody
Test dobrého stavu je bežný a možno najjednoduchší test vykonávaný pomocou chi-kvadrátovej štatistiky. V teste dobrej zhody vedec robí konkrétnu predpoveď o počtoch, ktoré očakáva v každej kategórii svojich údajov. Potom zbiera údaje z reálneho sveta - nazývané pozorované údaje - a pomocou testu chí-kvadrát zistí, či pozorované údaje zodpovedajú jej očakávaniam.
Predstavte si napríklad, že biológ študuje dedičské vzorce u druhu žaby. Genetický model biológov zo 100 potomkov zo skupiny žabiek ju vedie k očakávaniu 25 žltých potomkov, 50 zelených potomkov a 25 šedých potomkov. V skutočnosti pozoruje 20 žltých potomkov, 52 zelených potomkov a 28 šedých potomkov. Je jej predpoveď podporovaná alebo je jej genetický model nesprávny? Môže to zistiť pomocou testu chí-kvadrát.
Vypočítava sa štatistika Chi-Square
Začnite počítať štatistiku chí-kvadrát odpočítaním každej očakávanej hodnoty od jej zodpovedajúcej pozorovanej hodnoty a druhou mocninou každého výsledku. Výpočty pre príklad potomkovia žaby by vyzerali takto:
žltá = (20 - 25) ^ 2 = 25 zelená = (52 - 50) ^ 2 = 4 šedá = (28 - 25) ^ 2 = 9
Teraz vydelte každý výsledok zodpovedajúcou očakávanou hodnotou.
žltá = 25 x 25 = 1 zelená = 4 x 50 = 0,08 šedá = 9 x 25 = 0,36
Nakoniec sčítajte odpovede z predchádzajúceho kroku.
štvorcový štvorec = 1 + 0,08 + 0,36 = 1,44
Interpretácia Chi-Square štatistiky
Štatistika chí-kvadrát vám povie, aké odlišné boli vaše pozorované hodnoty od vašich predpokladaných hodnôt. Čím vyššie je číslo, tým väčší je rozdiel. Môžete zistiť, či je vaša hodnota štvorca príliš vysoká alebo nízka na to, aby podporovala vašu predpoveď, zistením, či je pod určitou hranicou. kritická hodnota na distribučnom stole chi-square. Táto tabuľka porovnáva chí-kvadrát hodnoty s pravdepodobnosťou hodnoty p, Tabuľka konkrétne uvádza pravdepodobnosť, že rozdiely medzi vašimi pozorovanými a očakávanými hodnotami sú jednoducho spôsobené náhodnou náhodou alebo či je prítomný nejaký iný faktor. Ak je hodnota p = 0,05 alebo nižšia, pre test dobrej zhody je potrebné predikciu odmietnuť.
Musíte určiť stupne slobody (df) vo vašich údajoch skôr, ako budete môcť vyhľadať kritickú hodnotu chí-kvadrát v distribučnej tabuľke. Stupne slobody sa počítajú odpočítaním 1 od počtu kategórií v údajoch. V tomto príklade sú tri kategórie, takže existujú 2 stupne voľnosti. Stručný pohľad na túto distribučnú tabuľku v štvorci chi ukazuje, že pre 2 stupne voľnosti je kritická hodnota pre pravdepodobnosť 0,05 5,99. To znamená, že pokiaľ je vaša vypočítaná hodnota štvorca menšia ako 5,99, vaše očakávané hodnoty, a teda aj základná teória, sú platné a podporované. Keďže štatistika chí-kvadrát pre údaje o potomkoch žabiek bola 1,44, môže biológ akceptovať jej genetický model.