サンプルサイズはどう決めるべき？

2025.02.11 統計学統計学入門

1. はじめに

統計調査やデータ分析を行う際、「サンプルサイズをいくつにすればよいのか？」と悩んだことはありませんか？サンプル数が少なすぎると信頼性が低くなり、多すぎるとコストや時間がかかります。

統計的に正しいサンプルサイズを決めるには、精度・信頼性・統計的検定の観点 を考慮することが重要です。

この記事では、サンプルサイズの決め方を体系的に解説し、実践的な計算方法についても説明します。

2. サンプルサイズを決める際に考慮すべきポイント

適切なサンプルサイズを決定するためには、以下の要素を考慮する必要があります。

① 許容誤差（Margin of Error）

調査結果がどれくらいの誤差を許容できるかを決めます。一般的に、誤差が小さいほど必要なサンプルサイズは大きくなります。

② 信頼水準（Confidence Level）

結果の信頼性をどの程度確保したいかを示します。一般的な信頼水準として 95%（0.05の有意水準） や 99%（0.01の有意水準） がよく用いられます。

③ 母集団の大きさ（Population Size）

母集団全体の人数や規模がサンプルサイズの決定に影響します。母集団が非常に大きい場合、サンプルサイズは一定以上増えにくくなります。

④ 標準偏差（Standard Deviation）

データのばらつきが大きいと、より多くのサンプルが必要になります。事前に既存データを用いて標準偏差を推定するのが望ましいです。

⑤ 力（Power）と効果量（Effect Size）

統計的検定を行う場合、検定の力（Power）と効果量（Effect Size）が重要です。特に、仮説検定を行う場合、80%の検出力（Power = 0.8）が標準的な基準となります。

3. サンプルサイズの計算方法

では、実際にサンプルサイズを計算する方法をいくつか紹介します。

① 平均のサンプルサイズの計算（母平均を推定する場合）

母平均を推定するために必要なサンプルサイズは、次の式で求められます。

n = (Z × 標準偏差 ÷ 許容誤差)²

n：必要なサンプルサイズ
Z：標準正規分布の値（95%の信頼水準なら1.96）
標準偏差：既存データから推定したばらつき
許容誤差：調査結果がどの程度ずれてもよいかを示す値

例えば、標準偏差が10、許容誤差を2、信頼水準95%（Z = 1.96）とした場合、サンプルサイズは次のようになります。

n = (1.96 × 10 ÷ 2)² = 96.04（約97）

つまり、97人のサンプルが必要となります。

② 比率のサンプルサイズの計算（母比率を推定する場合）

調査で「賛成 or 反対」などの割合を調べる場合、次の式を用います。

n = (Z² × p × (1 – p)) ÷ E²

p：予想される比率（例：50%なら p = 0.5）
E：許容誤差

例えば、信頼水準95%（Z = 1.96）、予想比率50%（p = 0.5）、許容誤差5%（E = 0.05）とすると、

n = (1.96² × 0.5 × 0.5) ÷ 0.05² = 384.16（約385）

つまり、385人のサンプルが必要になります。

4. サンプルサイズの決め方の実践的アプローチ

実際にサンプルサイズを決める際には、以下の方法を組み合わせると良いでしょう。

① 既存の研究を参考にする

過去の類似研究のサンプルサイズを調査し、それを基準にするのも一つの方法です。

② パイロット調査を行う

最初に小規模な調査を実施し、標準偏差や効果量を見積もることで、より正確なサンプルサイズを決められます。

③ ソフトウェアを活用する

統計ソフト（R, Python, G*Power など）を使うと、サンプルサイズの計算が簡単に行えます。

5. まとめ

サンプルサイズは「精度・信頼水準・母集団の大きさ・標準偏差・統計的検定」の要素を考慮して決める。
母平均を推定する場合、標準偏差と許容誤差を用いて計算する。
母比率を推定する場合、予想される割合と許容誤差をもとに計算する。
既存研究の参照やパイロット調査、統計ソフトの活用も有効な手段。

統計的に適切なサンプルサイズを設定することで、より信頼性の高いデータ分析が可能になります。適切なサンプルサイズの設定を心がけ、統計的に意味のある調査や実験を行いましょう！

前の記事へ

記事一覧へもどる

次の記事へ

統計学にご興味のある方へ

blog お役立ちブログ