
目次
1. はじめに
統計学を学んでいると、「平均」「分散」「標準偏差」という言葉をよく耳にしますよね。どれもデータの特徴を表す大切な指標ですが、「何が違うの?」「どう使い分けるの?」と迷うこともあるのではないでしょうか。
この記事では、それぞれの概念をわかりやすく解説し、どのような場面で使えばよいのかを整理していきます。
2. 平均とは?
まずは「平均」について考えてみましょう。平均とは、データの中心的な値を示す指標です。
平均の計算方法
平均は、データの合計をデータの個数で割ることで求められます。
例えば、テストの点数が「60, 70, 80, 90, 100」だったとしましょう。この場合、
(60 + 70 + 80 + 90 + 100)÷ 5 = 80
となります。
平均の使いどころ
平均は、データの「中心的な傾向」を知るのに適しています。ただし、極端な値(外れ値)があると、その影響を受けやすいという弱点があります。
3. 分散とは?
次に「分散」について説明します。分散とは、データのばらつきを数値で表す指標です。
分散の計算方法
分散は、各データが平均からどれだけ離れているかを2乗し、その平均を求めることで計算されます。
先ほどのテストの点数の例で平均が80でした。各データから80を引いた値を2乗し、その平均を求めると分散が計算できます。
((60-80)² + (70-80)² + (80-80)² + (90-80)² + (100-80)²)÷ 5 = 200
分散の使いどころ
分散を使うと、データが平均からどのくらいバラついているのかを把握できます。ただし、単位が元のデータの単位の2乗になってしまうため、解釈しにくいというデメリットがあります。
4. 標準偏差とは?
標準偏差は、分散の平方根を取ったものです。これにより、元のデータと同じ単位でばらつきを表現できるようになります。
標準偏差の計算方法
標準偏差は、分散の平方根を取ることで求められます。
先ほどの例で分散が200でしたので、その平方根を取ると、標準偏差は約14.14となります。
標準偏差の使いどころ
標準偏差は、データのばらつきを直感的に把握するのに適しています。例えば、「テストの平均点が80点で、標準偏差が10点」だとすると、多くの生徒が 70点~90点の範囲に分布していると考えられます。
5. 平均・分散・標準偏差の違いと使い分け
ここまでの内容を整理すると、次のようになります。
指標 | 意味 | 計算方法 |
---|---|---|
平均 | データの中心的な値を示す | データの合計 ÷ データの個数 |
分散 | データのばらつきの大きさを示す | 各データと平均の差を2乗し、その平均を求める |
標準偏差 | 分散の平方根を取った値 | 分散の平方根を計算する |
どの指標を使えばよいか?
- データの「中心」を知りたいとき → 平均
- データの「ばらつき」を知りたいとき → 分散または標準偏差
- データのばらつきを直感的に理解したいとき → 標準偏差
6. まとめ
平均・分散・標準偏差は、それぞれ異なる視点でデータを分析するための重要な指標です。
- 平均 はデータの中心を示す
- 分散 はデータのばらつきの大きさを示す
- 標準偏差 はばらつきを直感的に理解しやすくする
データを分析する際には、これらの指標をうまく使い分けることで、より深い洞察を得ることができます。実際にデータを計算しながら、しっかり理解していきましょう!