Stikprøven er den del af populationen, som hjælper os med at drage konklusioner om populationen. Det er ikke muligt at indsamle forskning af alle oplysninger om populationen, og det er tidskrævende og dyrt. Derfor har vi brug for en passende stikprøvestørrelse, så vi kan drage konklusioner om populationen på baggrund af denne stikprøve.
Et af de hyppigste problemer i statistisk analyse er fastlæggelsen af den passende stikprøvestørrelse. Man kan spørge, hvorfor stikprøvestørrelsen er så vigtig. Svaret herpå er, at en passende stikprøvestørrelse er nødvendig for validiteten. Hvis stikprøvestørrelsen er for lille, vil den ikke give valide resultater. En passende stikprøvestørrelse kan give nøjagtige resultater. Desuden vil resultaterne fra den lille stikprøvestørrelse være tvivlsomme. En for stor stikprøvestørrelse vil medføre spild af penge og tid. Det er også uetisk at vælge en for stor stikprøvestørrelse. Der findes ikke nogen bestemt tommelfingerregel for at bestemme stikprøvens størrelse. Nogle forskere støtter dog en tommelfingerregel, når de bruger stikprøvestørrelsen. I regressionsanalyser siger mange forskere f.eks., at der bør være mindst 10 observationer pr. variabel. Hvis vi bruger tre uafhængige variabler, ville en klar regel være, at der skal være en stikprøvestørrelse på mindst 30. Nogle forskere følger en statistisk formel til beregning af stikprøvestørrelsen.
Stikprøvestørrelse baseret på konfidensintervaller: Ved beregning af stikprøvestørrelsen er vi interesseret i at beregne populationsparameteren. Derfor bør vi bestemme konfidensintervallerne, så alle værdierne i stikprøven ligger inden for dette intervalområde.
Stikprøvestørrelsesberegning baseret på effektstørrelse
En alternativ tilgang til beregning af stikprøvestørrelsen er effektstørrelse. Effektstørrelse er kendt som forskellen mellem stikprøvestatistikkerne divideret med standardfejlen. Mere effektivt er det som følger:
Når en effektstørrelse er blevet estimeret, kan følgende tabel bruges til at estimere en stikprøve:
Som nævnt ovenfor er alfa lig med den acceptable sandsynlighed for type I-fejl, og beta er den acceptable sandsynlighed for type to-fejl og 1-beta lig med effekten. Da effekten vil stige med forskellige niveauer af alfa, vil stikprøvens størrelse også stige.