サンプルとは、母集団に関する推論を行うのに役立つ母集団の一部です。 母集団の全情報を調査することは不可能であり、時間と費用がかかる。 したがって、その標本に基づいて母集団についての推論ができるように、適切な標本サイズが必要である。
統計解析で最も頻繁に起こる問題の1つは、適切な標本サイズの決定である。 なぜ標本サイズがそんなに重要なのかと思われるかもしれない。 その答えは、適切な標本サイズが妥当性のために必要だからである。 サンプルサイズが小さすぎると、有効な結果が得られない。 適切なサンプルサイズは、結果の正確さを生み出すことができる。 また、サンプルサイズが小さいと、その結果には疑問が残ります。 サンプルサイズが大きすぎると、お金と時間を無駄にすることになります。 また、大きすぎるサンプルサイズを選択することは、非倫理的です。 サンプルサイズを決定するための一定の経験則はありません。 しかし、一部の研究者は、サンプルサイズを使用する際の経験則を支持しています。 例えば、回帰分析では、多くの研究者は、変数あたり少なくとも10個のオブザベーションがあるべきであると言っています。 もし、3つの独立変数を使用するのであれば、明確なルールとして、最低30個のサンプルサイズを持つことになります。 信頼区間に基づくサンプルサイズ
サンプルサイズを計算するために、統計的な公式に従っている研究者もいます。 サンプルサイズの計算では、母集団のパラメータを計算することに関心があります。 したがって、サンプルのすべての値がその区間範囲内にあるように、信頼区間を決定する必要があります。
効果量に基づくサンプルサイズの計算
サンプルサイズの計算の別のアプローチは、効果量です。 効果量は標本統計量の差を標準誤差で割った値として知られています。 より効率的には次のようになります:
一旦効果サイズが推定されると、次の表を使用してサンプルを推定することができます:
前述のように、アルファは第1種過誤の許容確率に、ベータは第2種過誤の許容確率、1-ベータは検出力に等しいです。 アルファのレベルが異なると検出力が大きくなるので、サンプルサイズも大きくなります。