
目次
1. はじめに
統計学を学んでいると「標準誤差」と「標準偏差」という言葉を耳にすることがありますよね。どちらもデータのばらつきを表す指標ですが、「何が違うの?」「どんな場面で使うの?」と疑問に思う方も多いのではないでしょうか。
結論から言うと、
- 標準偏差 は「データ全体のばらつき」を示す指標
- 標準誤差 は「サンプルの統計量がどの程度安定しているか」を示す指標
この記事では、標準誤差と標準偏差の違いをわかりやすく解説し、それぞれの使いどころについても説明していきます。
2. 標準偏差とは?
標準偏差(standard deviation)とは、データの散らばり具合を示す指標です。個々のデータが平均値の周りでどの程度ばらついているのかを表します。
標準偏差の計算方法
標準偏差は、次のように求めます。
- 各データから平均を引く(偏差を求める)
- その値を2乗する(正の値にするため)
- すべてのデータについて平均を取る(分散を求める)
- その平方根を取る(元の単位に戻す)
例えば、あるクラスのテストの点数が「60, 70, 80, 90, 100」だったとします。この場合、
- 平均点は 80 点
- 各点数の平均からの差を2乗し、その平均を取ると分散が求まる
- 分散の平方根を取ると標準偏差になる
標準偏差の使いどころ
標準偏差は、データの散らばり具合を知るのに便利です。
- 値が大きい → データのばらつきが大きい(個々のデータが平均から遠い)
- 値が小さい → データのばらつきが小さい(個々のデータが平均に近い)
3. 標準誤差とは?
標準誤差(standard error)とは、サンプルの統計量が母集団の真の値とどの程度ずれている可能性があるか を示す指標です。
例えば、あるクラスの100人の平均身長を調査したいとします。しかし、全員を調べるのは大変なので、ランダムに10人を選んで平均身長を計算しました。このとき、サンプルの平均身長が本当の母集団の平均身長とどの程度ずれているのかを知るために、標準誤差を使います。
標準誤差の計算方法
標準誤差は、標準偏差をサンプルサイズの平方根で割ることで求められます。
- 標準偏差を求める
- 標準偏差をサンプルサイズの平方根で割る
サンプルサイズが大きくなるほど、標準誤差は小さくなります。つまり、サンプルサイズが大きいほど、平均値のブレが小さくなるということです。
標準誤差の適用範囲
標準誤差は、平均に限らず、さまざまな統計量に対して計算されます。例えば、
- 平均の標準誤差(SEM):サンプル平均の信頼性を測る
- 分散の標準誤差:サンプル分散が母集団の分散とどの程度異なるかを測る
- 標準偏差の標準誤差:サンプルの標準偏差が母集団の標準偏差とどれくらいズレる可能性があるかを測る
- 回帰係数の標準誤差:回帰分析において、推定された回帰係数の不確実性を示す
- 相関係数の標準誤差:サンプル相関が母集団の相関とどの程度異なる可能性があるかを測る
- 比率の標準誤差:アンケート調査などで得られた割合の誤差を測る
標準誤差は、「サンプルをもとに計算した統計量」が「母集団の真の値」とどれくらい異なるかを評価するために用いられます。
4. 標準偏差と標準誤差の違い
ここまでの内容を整理すると、次のようになります。
指標 | 意味 | 計算方法 | 使いどころ |
---|---|---|---|
標準偏差 | データのばらつきの大きさを示す | データの分散の平方根を取る | データ全体のばらつきを測る |
標準誤差 | サンプルの統計量の安定性を示す | 標準偏差をサンプルサイズの平方根で割る | サンプル統計量が母集団にどれくらい近いかを測る |
どちらを使うべき?
- データのばらつきを知りたいなら → 標準偏差
- サンプルから推測した統計量の信頼性を測りたいなら → 標準誤差
例えば、
- 「テストの点数の分布を知りたい」なら標準偏差を使う
- 「サンプルから推測した平均値や相関係数の信頼性を知りたい」なら標準誤差を使う
5. まとめ
- 標準偏差はデータのばらつきを示す指標 で、データ全体の散らばりを表す。
- 標準誤差はサンプルの統計量の信頼性を示す指標 で、サンプルが母集団の統計量にどれだけ近いかを測る。
- 標準誤差は平均だけでなく、分散、標準偏差、相関係数、回帰係数、比率など、さまざまな統計量に適用される。
- 標準偏差は「データのばらつき」を測り、標準誤差は「サンプル統計量の安定性」を測る。
統計データを扱う際には、この2つの違いを正しく理解して、適切に使い分けることが大切ですね!