De steekproef is het deel van de populatie dat ons helpt om conclusies te trekken over de populatie. Het verzamelen van de volledige informatie over de populatie is niet mogelijk en het is tijdrovend en duur. Daarom hebben wij een passende steekproefgrootte nodig, zodat wij op basis van die steekproef conclusies kunnen trekken over de bevolking.
Een van de meest voorkomende problemen bij statistische analyse is het bepalen van de juiste steekproefgrootte. Men kan zich afvragen waarom de steekproefgrootte zo belangrijk is. Het antwoord hierop is dat een passende steekproefgrootte noodzakelijk is voor de validiteit. Als de steekproef te klein is, zal dit geen geldige resultaten opleveren. Een passende steekproefomvang kan nauwkeurige resultaten opleveren. Bovendien zullen de resultaten van een kleine steekproefomvang twijfelachtig zijn. Een te grote steekproef zal resulteren in geld- en tijdverspilling. Het is ook onethisch om een te grote steekproef te kiezen. Er is geen zekere vuistregel om de steekproefgrootte te bepalen. Sommige onderzoekers zijn wel voorstander van een vuistregel bij het gebruik van de steekproefgrootte. Bijvoorbeeld, bij regressieanalyse zeggen veel onderzoekers dat er minstens 10 waarnemingen per variabele moeten zijn. Als we drie onafhankelijke variabelen gebruiken, dan zou een duidelijke regel zijn dat de steekproefgrootte minimaal 30 moet zijn. Sommige onderzoekers volgen een statistische formule om de steekproefgrootte te berekenen.
Steekproefgrootte op basis van betrouwbaarheidsintervallen: Bij het berekenen van de steekproefgrootte zijn we geïnteresseerd in het berekenen van de populatieparameter. We moeten dus de betrouwbaarheidsintervallen bepalen, zodat alle waarden van de steekproef binnen dat intervalbereik liggen.
Berekening van de steekproefgrootte op basis van de effectgrootte
Een alternatieve benadering voor het berekenen van de steekproefgrootte is de effectgrootte. De effectgrootte is bekend als het verschil tussen de steekproefstatistieken gedeeld door de standaardfout. Efficiënter is het als volgt:
Als eenmaal een effectgrootte is geschat, kan de volgende tabel worden gebruikt om een steekproef te schatten:
Zoals hierboven vermeld, is alpha gelijk aan de aanvaardbare kans op de type I-fout en beta aan de aanvaardbare kans op type 2-fouten en 1-beta gelijk aan het vermogen. Aangezien het vermogen toeneemt met verschillende alfa-niveaus, neemt ook de steekproefgrootte toe.