blog お役立ちブログ

標準偏差・分散・平均の違いと使い分け

1. はじめに

統計学を学んでいると、「平均」「分散」「標準偏差」という言葉をよく耳にしますよね。どれもデータの特徴を表す大切な指標ですが、「何が違うの?」「どう使い分けるの?」と迷うこともあるのではないでしょうか。

この記事では、それぞれの概念をわかりやすく解説し、どのような場面で使えばよいのかを整理していきます。

2. 平均とは?

まずは「平均」について考えてみましょう。平均とは、データの中心的な値を示す指標です。

平均の計算方法

平均は、データの合計をデータの個数で割ることで求められます。

例えば、テストの点数が「60, 70, 80, 90, 100」だったとしましょう。この場合、

(60 + 70 + 80 + 90 + 100)÷ 5 = 80

となります。

平均の使いどころ

平均は、データの「中心的な傾向」を知るのに適しています。ただし、極端な値(外れ値)があると、その影響を受けやすいという弱点があります。

3. 分散とは?

次に「分散」について説明します。分散とは、データのばらつきを数値で表す指標です。

分散の計算方法

分散は、各データが平均からどれだけ離れているかを2乗し、その平均を求めることで計算されます。

先ほどのテストの点数の例で平均が80でした。各データから80を引いた値を2乗し、その平均を求めると分散が計算できます。

((60-80)² + (70-80)² + (80-80)² + (90-80)² + (100-80)²)÷ 5 = 200

分散の使いどころ

分散を使うと、データが平均からどのくらいバラついているのかを把握できます。ただし、単位が元のデータの単位の2乗になってしまうため、解釈しにくいというデメリットがあります。

4. 標準偏差とは?

標準偏差は、分散の平方根を取ったものです。これにより、元のデータと同じ単位でばらつきを表現できるようになります。

標準偏差の計算方法

標準偏差は、分散の平方根を取ることで求められます。

先ほどの例で分散が200でしたので、その平方根を取ると、標準偏差は約14.14となります。

標準偏差の使いどころ

標準偏差は、データのばらつきを直感的に把握するのに適しています。例えば、「テストの平均点が80点で、標準偏差が10点」だとすると、多くの生徒が 70点~90点の範囲に分布していると考えられます。

5. 平均・分散・標準偏差の違いと使い分け

ここまでの内容を整理すると、次のようになります。

指標意味計算方法
平均データの中心的な値を示すデータの合計 ÷ データの個数
分散データのばらつきの大きさを示す各データと平均の差を2乗し、その平均を求める
標準偏差分散の平方根を取った値分散の平方根を計算する

どの指標を使えばよいか?

  • データの「中心」を知りたいとき → 平均
  • データの「ばらつき」を知りたいとき → 分散または標準偏差
  • データのばらつきを直感的に理解したいとき → 標準偏差

6. まとめ

平均・分散・標準偏差は、それぞれ異なる視点でデータを分析するための重要な指標です。

  • 平均 はデータの中心を示す
  • 分散 はデータのばらつきの大きさを示す
  • 標準偏差 はばらつきを直感的に理解しやすくする

データを分析する際には、これらの指標をうまく使い分けることで、より深い洞察を得ることができます。実際にデータを計算しながら、しっかり理解していきましょう!