blog お役立ちブログ

正規分布とは?身近な例で理解しよう!

1. はじめに

統計学を学んでいると「正規分布」という言葉をよく耳にしますよね。正規分布は、多くの自然現象や社会現象のデータに見られる重要な確率分布です。

しかし、「正規分布って何?」「なぜそんなに大事なの?」と疑問に思う方もいるかもしれません。

結論から言うと、

  • 正規分布とは「データの分布が左右対称で、平均を中心に山型の形になる分布」です。
  • 身近な例として、「身長」「テストの点数」「測定誤差」などが正規分布に近い形をしています。
  • 統計学では、正規分布を前提に多くの分析手法が成り立っています。

この記事では、正規分布の特徴や身近な例、なぜ重要なのかについてわかりやすく解説していきます。

2. 正規分布とは?

正規分布の定義

正規分布(Normal Distribution)とは、データの分布が左右対称で、平均値を中心に最も多くのデータが集まり、両端に行くほどデータの出現頻度が低くなる分布のことです。

例えば、あるクラスのテストの点数を調べたとき、多くの生徒が平均点の周辺に集まり、極端に高い点数や低い点数を取る生徒は少ないですよね? これが正規分布の典型的な形です。

正規分布の特徴

  1. 左右対称:平均値を中心に左右対称の形をしている。
  2. 平均値・中央値・最頻値が同じ:データの「中心」を示す3つの指標がすべて同じ値になる。
  3. 標準偏差がばらつきを決める:標準偏差が小さいと細く鋭い山、大きいと広がった形になる。
  4. 68-95-99.7の法則(68-95-99.7 Rule)
    • 平均 ± 1標準偏差 の範囲にデータの約 68% が含まれる。
    • 平均 ± 2標準偏差 の範囲にデータの約 95% が含まれる。
    • 平均 ± 3標準偏差 の範囲にデータの約 99.7% が含まれる。

この性質により、データがどの範囲に収まるかの予測がしやすくなります。

3. 正規分布の身近な例

「正規分布は理論的な話だけでは?」と思うかもしれませんが、実は私たちの身の回りにもたくさんの正規分布が存在します。

① 人の身長

多くの人の身長を測ると、平均身長の周辺に最も多くの人がいて、極端に高い人や低い人は少数です。これは正規分布の典型的な例です。

② テストの点数

学校のテストでも、平均点付近に多くの生徒が集まり、極端に高得点や低得点の生徒は少なくなります。特に、問題が適切に設計されているテストでは、正規分布に近い形になります。

③ 血圧や体温などの生理データ

健康診断のデータを見ると、血圧や体温などの測定値も正規分布に近い形をとることが多いです。

④ 製品の寸法や測定誤差

工場で製造される部品の寸法や、測定誤差も正規分布に従うことがよくあります。例えば、ネジの長さが50mmの設計でも、実際には50.1mmや49.9mmといった小さな誤差が発生しますが、それらは正規分布することが多いです。

4. なぜ正規分布は重要なのか?

正規分布が重要視される理由は、多くの統計的手法が正規分布を前提にしているから です。

① 統計的推測(t検定・回帰分析など)

多くの統計的手法(t検定、回帰分析、ANOVAなど)は、データが正規分布に従っていると仮定して計算を行います。そのため、正規分布に近いデータであれば、より正確な分析ができます。

② 中心極限定理(Central Limit Theorem)

中心極限定理とは、「どんな分布のデータでも、サンプルの平均をたくさん取ると、その平均値は正規分布に近づく」という理論です。これにより、多くの統計的な推定が可能になります。

③ 標準化(Zスコア)

正規分布のデータは、平均を0、標準偏差を1に変換することで、どんなデータでも比較しやすくなります。これは「標準化(Zスコア変換)」と呼ばれ、統計分析の基本となります。

5. まとめ

  • 正規分布は、平均を中心とした左右対称の山型の分布で、多くのデータがこの形に従う。
  • 身長、テストの点数、測定誤差など、身近なデータが正規分布に近い形を示すことが多い。
  • 統計学では、正規分布を前提とした手法が多く、データが正規分布に近いほど分析しやすい。
  • 中心極限定理によって、データの分布が多少異なっていても、サンプルの平均は正規分布に近づくため、多くの統計的手法が成り立つ。

このように、正規分布は統計学の基礎としてとても重要な概念です。日常生活のデータにも広く見られるため、ぜひ意識してみてくださいね!