Obsah
- TL; DR (príliš dlho; neprečítané)
- Definícia veľkosti vzorky
- Výpočet veľkosti vzorky
- Nebezpečenstvo malej veľkosti vzorky
- Veľkosť vzorky a rozpätie chyby
Veľkosť vzorky je počet jednotlivých vzoriek alebo pozorovaní v akomkoľvek štatistickom prostredí, ako je napríklad vedecký experiment alebo prieskum verejnej mienky. Aj keď ide o pomerne jednoduchý koncept, výber veľkosti vzorky je kritickým určením projektu. Príliš malá vzorka poskytuje nespoľahlivé výsledky, zatiaľ čo príliš veľká vzorka vyžaduje veľa času a zdrojov.
TL; DR (príliš dlho; neprečítané)
Veľkosť vzorky je priamy počet zmeraných vzoriek alebo pozorovaní.
Definícia veľkosti vzorky
Veľkosť vzorky meria počet jednotlivých meraných vzoriek alebo pozorovaní použitých pri prieskume alebo experimente. Napríklad, ak testujete 100 vzoriek pôdy na dôkaz kyslého dažďa, veľkosť vzorky je 100. Ak online prieskum vrátil 30 500 vyplnených dotazníkov, veľkosť vzorky je 30 500. V štatistike veľkosť vzorky je vo všeobecnosti reprezentovaná premennou „n“.
Výpočet veľkosti vzorky
Pri určovaní veľkosti vzorky potrebnej pre experiment alebo prieskum vedci berú do úvahy množstvo požadovaných faktorov. Najprv, celková veľkosť skúmanej populácie musí sa zvážiť - napríklad prieskum, ktorý sa snaží vyvodiť závery o celom štáte New York, bude potrebovať omnoho väčšiu veľkosť vzorky, ako je tá, ktorá sa konkrétne zameriava na Rochester. Vedci budú musieť zvážiť aj miera chybyspoľahlivosť, že zhromaždené údaje sú vo všeobecnosti presné; a úroveň sebavedomia, pravdepodobnosť presnosti rozpätia chyby. A nakoniec, výskumníci musia zohľadniť smerodajná odchýlka očakávajú, že v údajoch uvidia. Štandardná odchýlka meria, do akej miery sa jednotlivé časti údajov líšia od priemerných nameraných údajov. Napríklad vzorky pôdy z jedného parku budú mať pravdepodobne oveľa menšiu štandardnú odchýlku v obsahu dusíka ako pôdy zozbierané z celého kraja.
Nebezpečenstvo malej veľkosti vzorky
Aby štatistika bola presná a spoľahlivá, sú potrebné veľké veľkosti vzoriek, najmä ak sa jej zistenia majú extrapolovať na väčšiu populáciu alebo skupinu údajov. Povedzme, že ste vykonávali prieskum týkajúci sa cvičenia, a viedli ste rozhovor s piatimi ľuďmi, z ktorých dvaja uviedli, že každoročne organizujú maratón. Ak použijete tento prieskum na reprezentáciu populácie krajiny ako celku, potom podľa vášho prieskumu vedie 40 percent ľudí najmenej jeden maratón ročne - nečakane vysoké percento. Čím je menšia veľkosť vzorky, tým je pravdepodobnejšia outliers - nezvyčajné údaje - majú skresliť vaše zistenia.
Veľkosť vzorky a rozpätie chyby
Veľkosť vzorky štatistického zisťovania priamo súvisí aj s mierou chýb v zisťovaní. Rozpätie chyby je percento, ktoré vyjadruje pravdepodobnosť, že prijaté údaje sú presné, Napríklad v prieskume o náboženskej viere je miera chyby percentuálnym podielom respondentov, od ktorých sa dá očakávať, že v prípade opakovaného prieskumu poskytnú rovnakú odpoveď. Ak chcete určiť mieru chyby, vydeľte 1 druhou odmocninou veľkosti vzorky a potom vynásobte 100, aby ste dostali percento, Napríklad veľkosť vzorky 2 400 bude mať chybovú rezervu 2,04 percenta.