Vzor je část populace, která nám pomáhá vyvozovat závěry o populaci. Shromáždění výzkumu kompletních informací o populaci není možné a je časově i finančně náročné. Proto potřebujeme vhodnou velikost vzorku, abychom na jeho základě mohli činit závěry o populaci.
Jedním z nejčastějších problémů statistické analýzy je určení vhodné velikosti vzorku. Můžeme se ptát, proč je velikost vzorku tak důležitá. Odpověď na ni zní, že vhodná velikost vzorku je nutná pro zajištění validity. Pokud je velikost vzorku příliš malá, nepřinese platné výsledky. Vhodná velikost vzorku může přinést přesnost výsledků. Navíc výsledky z malé velikosti vzorku budou sporné. Příliš velká velikost vzorku povede k plýtvání penězi a časem. Je také neetické zvolit příliš velkou velikost vzorku. Neexistuje žádné určité pravidlo pro určení velikosti vzorku. Někteří výzkumníci však při používání velikosti vzorku podporují pravidlo palce. Například v regresní analýze mnozí výzkumníci tvrdí, že na jednu proměnnou by mělo připadat alespoň 10 pozorování. Pokud používáme tři nezávislé proměnné, pak by jasným pravidlem bylo mít minimální velikost vzorku 30 pozorování. Někteří výzkumníci se při výpočtu velikosti vzorku řídí statistickým vzorcem:
Velikost vzorku na základě intervalů spolehlivosti: Při výpočtu velikosti vzorku nás zajímá výpočet populačního parametru. Měli bychom tedy určit intervaly spolehlivosti tak, aby všechny hodnoty vzorku ležely v tomto intervalu.
Výpočet velikosti vzorku na základě velikosti účinku
Alternativním přístupem k výpočtu velikosti vzorku je velikost účinku. Velikost účinku je známa jako rozdíl mezi výběrovými statistikami dělený standardní chybou. Efektivněji vypadá takto:
Po odhadu velikosti efektu lze k odhadu vzorku použít následující tabulku:
Jak bylo uvedeno výše, alfa je rovna přijatelné pravděpodobnosti chyby typu I a beta je přijatelná pravděpodobnost chyby typu dvě a 1-beta se rovná síle. Vzhledem k tomu, že s různými úrovněmi alfa se bude zvyšovat síla, bude se zvyšovat i velikost vzorku.
.