Obsah
- Náhodné vzorkovanie
- presnosť
- Intervaly spoľahlivosti
- Štandardná chyba
- Ťažkosti s používaním väčších veľkostí vzoriek
Veľkosť vzorky predstavuje počet pozorovaní uskutočnených na vykonanie štatistickej analýzy. Veľkosti vzoriek môžu pozostávať z ľudí, zvierat, šarží potravín, strojov, batérií alebo z akejkoľvek populácie, ktorá sa hodnotí.
Náhodné vzorkovanie
Náhodný odber vzoriek je metóda, ktorou sa náhodne odoberajú vzorky z populácie s cieľom odhadnúť informácie o populácii bez zaujatosti. Napríklad, ak chcete vedieť, aký typ ľudí žije v určitom meste, musíte náhodne robiť rozhovory s rôznymi ľuďmi. Keby ste však práve všetkých použili z knižnice, nemali by ste spravodlivý / nezaujatý odhad toho, aká je všeobecná populácia obyvateľov mesta, iba ľudí, ktorí chodia do knižnice.
presnosť
S rastúcou veľkosťou vzorky sa odhady stanú presnejšími. Napríklad, ak sme náhodne vybrali 10 dospelých mužov, možno zistíme, že ich priemerná výška je vysoká 6 stôp - 3 palce, pravdepodobne preto, že existuje náš basketbalový hráč, ktorý nafúkne náš odhad. Keby sme však zmerali dva milióny dospelých mužov, mali by sme lepšieho prediktora priemernej výšky mužov, pretože extrémy by sa vyrovnali a skutočný priemer by zatienil akékoľvek odchýlky od priemeru.
Intervaly spoľahlivosti
Keď štatistik predpovedá výsledok, často zostaví interval okolo svojho odhadu. Napríklad, ak sme zmerali hmotnosť 100 žien, mohli by sme povedať, že sme si 90 percent istí, že skutočná priemerná hmotnosť žien je v intervale 103 až 129 libier. (To samozrejme záleží aj na ďalších faktoroch, ako je napríklad variabilita meraní.) Keď sa veľkosť vzorky zvyšuje, dôverujeme odhadu a intervaly sa zmenšujú. Napríklad s miliónom žien by sme mohli povedať, že sme si 98% istí, že skutočná priemerná hmotnosť žien je medzi 115 a 117 libier. Inými slovami, so zvyšujúcou sa veľkosťou vzorky sa zvyšuje naša dôvera v naše merania a veľkosť našich intervalov spoľahlivosti klesá.
Štandardná chyba
Variácia je miera šírenia údajov okolo priemeru. Štandardná odchýlka je druhá odmocnina variácie a pomáha priblížiť, aké percento populácie spadá medzi rozsah hodnôt relatívne k priemeru. Keď sa veľkosť vzorky zvyšuje, štandardná chyba, ktorá závisí od štandardnej odchýlky a veľkosti vzorky, sa znižuje. V dôsledku toho sa zvyšuje presnosť odhadov a výskum založený na týchto odhadoch sa považuje za spoľahlivejší (s menším rizikom chyby).
Ťažkosti s používaním väčších veľkostí vzoriek
Väčšie veľkosti vzoriek očividne vytvárajú lepšie a presnejšie odhady populácií, existuje však niekoľko problémov s výskumníkmi, ktorí používajú väčšie veľkosti vzoriek. Najprv môže byť ťažké nájsť náhodnú vzorku ľudí, ktorí sú ochotní vyskúšať nový liek. Ak tak urobíte, bude nákladnejšie poskytovať liek viacerým ľuďom a sledovať viac ľudí v priebehu času. Získanie a udržanie väčšej veľkosti vzorky navyše vyžaduje väčšie úsilie. Aj keď väčšie veľkosti vzoriek poskytujú presnejšiu štatistiku, dodatočné náklady a úsilie nie sú vždy potrebné, pretože menšie vzorky môžu tiež priniesť významné výsledky.