blog お役立ちブログ

t検定 vs カイ二乗検定 vs ANOVA|どれを使う?

1. はじめに

統計解析を行う際、「t検定」「カイ二乗検定」「ANOVA(分散分析)」のどれを使えばいいのか迷ったことはありませんか? それぞれの手法には適用できるデータや目的が異なります。

結論から言うと、

  • t検定 → 2つのグループの平均を比較するとき
  • カイ二乗検定 → カテゴリデータの関係を調べるとき
  • ANOVA(分散分析) → 3つ以上のグループの平均を比較するとき

この記事では、それぞれの検定の特徴や使いどころをわかりやすく解説します。

2. t検定とは?

t検定の概要

t検定(t-test)は、2つのグループの平均値が統計的に有意な差があるかを検定する方法です。例えば、「男性と女性の身長に差があるか?」を調べるときに使われます。

t検定の種類

  1. 対応のないt検定(独立サンプルt検定)
    • 2つの独立したグループの平均を比較する。
    • 例:「新しい薬を服用したグループと服用していないグループの血圧の違い」
  2. 対応のあるt検定(対応のあるサンプルt検定)
    • 同じ対象で測定を2回行い、前後の変化を比較する。
    • 例:「ダイエット前後の体重変化」

t検定の使いどころ

  • 平均値を比較したいとき
  • 比較するグループが2つのとき
  • データが連続値(数値データ)のとき

3. カイ二乗検定とは?

カイ二乗検定の概要

カイ二乗検定(chi-square test)は、カテゴリデータ(名義尺度)における2つの変数の関連性を調べる手法です。例えば、「喫煙習慣と肺がんの発生に関係があるか?」を分析する際に使います。

カイ二乗検定の種類

  1. 独立性のカイ二乗検定
    • 2つのカテゴリ変数の関連性を検定する。
    • 例:「性別とスマホのブランド選択に関係があるか?」
  2. 適合度のカイ二乗検定
    • 観測データが期待値(理論値)と一致するかを検定する。
    • 例:「サイコロを振ったときに6つの目が均等に出るか?」

カイ二乗検定の使いどころ

  • データがカテゴリ(例:性別、職業、アンケートの選択肢)
  • 2つの変数の関連性を知りたいとき
  • 期待値と実測値の違いを検証したいとき

4. ANOVA(分散分析)とは?

ANOVAの概要

ANOVA(Analysis of Variance、分散分析)は、3つ以上のグループの平均を比較する手法です。例えば、「A、B、Cの3つのダイエット方法で体重減少に差があるか?」を分析する際に使います。

ANOVAの種類

  1. 一元配置分散分析(One-way ANOVA)
    • 1つの要因によるグループ間の平均の差を検定する。
    • 例:「3つの異なる学習法によるテスト成績の違い」
  2. 二元配置分散分析(Two-way ANOVA)
    • 2つの要因が結果に与える影響を分析する。
    • 例:「学習法と性別がテスト成績に与える影響」

ANOVAの使いどころ

  • 比較するグループが3つ以上あるとき
  • データが連続値(数値データ)のとき
  • 複数の要因の影響を分析したいとき(二元配置分散分析)

5. どの検定を使うべき?

どの検定を選べばよいか迷ったときは、以下の基準で考えましょう。

目的データの種類比較するグループ数使用する検定
2つのグループの平均を比較連続値(数値データ)2つt検定
3つ以上のグループの平均を比較連続値(数値データ)3つ以上ANOVA
カテゴリデータの関連を調べるカテゴリデータ2つ以上カイ二乗検定

例えば、

  • 「男性と女性の平均身長を比較したい」→ t検定
  • 「3つの学習方法の成績を比較したい」→ ANOVA
  • 「血液型と性格の関係を調べたい」→ カイ二乗検定

このように、それぞれの目的に合った手法を選択することが大切です。

6. まとめ

  • t検定は2つのグループの平均値を比較する手法。
  • カイ二乗検定はカテゴリデータの関連性を調べる手法。
  • ANOVA(分散分析)は3つ以上のグループの平均を比較する手法。
  • データの種類(連続値 or カテゴリ)と比較するグループ数に応じて適切な検定を選ぶことが重要。

統計解析を行う際には、「何を知りたいのか?」を明確にして、適切な手法を選びましょう!