χ²分布とは?形・自由度・使い方をわかりやすく解説【統計検定2級】

分布

統計検定2級では、χ²分布(カイ二乗分布) がよく登場します。
ただ、最初は

  • どんな形の分布なのか
  • 正規分布やt分布と何が違うのか
  • 何のために使うのか

がつかみにくいです。

χ²分布は、χ²検定だけでなく、母分散の区間推定や検定にも関係する重要な分布です。

この記事では、

  • χ²分布の意味
  • 自由度による形の違い
  • どんな場面で使うのか
  • よくあるミス

を整理します。


この記事で分かること

  • χ²分布とは何か
  • χ²分布の形と特徴
  • 自由度が変わるとどうなるか
  • 統計検定2級での主な使い道
  • 正規分布・t分布との違い

χ²分布とは?

χ²分布は、標準正規分布に従う変数を二乗して足し合わせたものの分布です。

たとえば、互いに独立な標準正規分布

Z1, Z2, ..., Zk ~ N(0,1)

があるとき、

Z1² + Z2² + ... + Zk²

自由度 k の χ²分布 に従います。


χ²分布のイメージ

χ²分布のポイントは、二乗しているので負の値を取らないことです。

つまり、

  • 値は 0以上
  • 左右対称ではない
  • 右に長く尾を引く形になる

という特徴があります。

正規分布のような左右対称の山ではなく、右に歪んだ分布になるのが大きな特徴です。


自由度によって形が変わる

χ²分布は、自由度によって形がかなり変わります。

自由度が小さいとき

  • 0付近に山ができやすい
  • 強く右に歪む

自由度が大きくなると

  • 分布の山が右に移る
  • 相対的に左右対称に近づく
  • ばらつき方がなだらかになる

つまり、自由度が小さいほど歪みが強く、大きいほど滑らかになると覚えるとよいです。

χ²分布表

この表は χ²分布の上側確率表です。
行が自由度、列が上側確率で、交点の値が臨界値 χ² になります。

たとえば、自由度10・上側確率0.05なら χ² = 18.307 です。

自由度 0.10 0.05 0.025 0.01 0.005
12.7063.8415.0246.6357.879
24.6055.9917.3789.21010.597
36.2517.8159.34811.34512.838
47.7799.48811.14313.27714.860
59.23611.07012.83315.08616.750
610.64512.59214.44916.81218.548
712.01714.06716.01318.47520.278
813.36215.50717.53520.09021.955
914.68416.91919.02321.66623.589
1015.98718.30720.48323.20925.188
1117.27519.67521.92024.72526.757
1218.54921.02623.33726.21728.300
1319.81222.36224.73627.68829.819
1421.06423.68526.11929.14131.319
1522.30724.99627.48830.57832.801
1623.54226.29628.84532.00034.267
1724.76927.58730.19133.40935.718
1825.98928.86931.52634.80537.156
1927.20430.14432.97336.19138.582
2028.41231.41034.17037.56640.000
2129.61532.67135.47938.93241.401
2230.81333.92436.78140.28942.796
2332.00735.17238.07641.63844.181
2433.19636.41539.36442.98045.559
2534.38237.65240.64644.31446.928
2635.56338.88541.92345.64248.290
2736.74140.11343.19546.96349.645
2837.91641.33744.46148.27850.993
2939.08742.55745.72249.58852.336
3040.25643.77346.97950.89253.672
4051.80555.75859.34263.69166.766
6074.39779.08283.29888.37991.952
120140.233146.567152.211158.950163.648


問題(類似問題①)

χ²分布の特徴として適切なのはどれか。
A. 負の値も取る
B. 左右対称である
C. 0以上の値を取り、右に歪んだ形をする
D. 自由度によらず形は同じ


解答

C


解説

χ²分布は、標準正規分布を二乗して足し合わせた分布なので、負の値は取りません
また、左右対称ではなく、一般に右に歪んだ形をしています。
さらに、自由度が変わると分布の形も変わります。


χ²分布は何に使うのか?

統計検定2級での主な使い道は次の2つです。

χ²検定

  • 適合度の検定
  • 独立性の検定

カテゴリーデータを扱うときによく使います。

母分散に関する推定・検定

  • 母分散の区間推定
  • 母分散の検定

特に正規母集団では、標本分散から χ²分布が出てきます。


分散との関係

χ²分布は、標本分散と深く関係しています。

正規母集団から標本を取ったとき、

(n - 1)s² / σ²

は、自由度 n−1 の χ²分布 に従います。

この結果を使うことで、

  • 母分散の検定
  • 母分散の信頼区間

を作ることができます。

ここは統計検定2級で非常に重要です。


正規分布・t分布との違い

ここは混同しやすいので整理しておきます。

分布 主な特徴 値の範囲 代表的な用途
正規分布 左右対称 負も正も取る 標準化、z検定
t分布 左右対称、裾が厚い 負も正も取る t検定、母平均の推定
χ²分布 右に歪む 0以上 χ²検定、母分散の推定

問題(類似問題②)

自由度が大きくなると、χ²分布はどう変化するか。
A. 負の値を取るようになる
B. 右への歪みが相対的に小さくなる
C. 左右対称になる
D. 常に平均0に近づく


解答

B


解説

χ²分布は自由度が大きくなるほど、右への歪みが相対的に小さくなり、形がなだらかになります。
ただし、正規分布のように完全な左右対称になるわけではありません。


統計検定2級での見方

現時点では、χ²分布について次の3点を押さえれば十分です。

  • 0以上の値しか取らない
  • 自由度で形が変わる
  • χ²検定と母分散に関する問題で使う

特に今後、

  • χ²検定の記事
  • 母分散の区間推定の記事

を読むときの土台になります。


よくあるミス

  1. χ²分布を左右対称だと思ってしまう
    → χ²分布は基本的に右に歪んでいます。
  2. 負の値を取ると思ってしまう
    → 二乗和なので 0以上 です。
  3. 自由度が増えても形は同じだと思ってしまう
    → 自由度によって形はかなり変わります。
  4. t分布と用途を混同する
    → t分布は平均、χ²分布は分散やカテゴリーデータで使うことが多いです。

追加練習

問1

χ²分布が負の値を取らない理由を、ひとことで説明してください。

解答例
標準正規分布に従う変数を二乗して足し合わせたものだから。


問2

χ²分布を使う代表的な場面を2つ挙げてください。

解答例

  • χ²検定
  • 母分散の検定や区間推定

まとめ

  • χ²分布は、標準正規分布を二乗して足したものの分布
  • 値は 0以上
  • 左右対称ではなく、右に歪んだ形
  • 自由度が大きくなると、形はなだらかになる
  • χ²検定や母分散の推定で重要

次に読む


練習問題(noteの記事へ)

関連する問題をまとめて練習したい方へ:
統計検定2級「検定・推定」ドリル10問+解説

コメント

タイトルとURLをコピーしました