統計検定2級で χ²検定 を学ぶと、多くの人が最初につまずくのが 期待度数 です。
- なぜ掛け算して割るのか
- 観測度数と何が違うのか
- どの表でも同じように求めてよいのか
ここが曖昧だと、χ²検定の式を覚えても問題が解けません。
この記事では、特に頻出の 独立性の検定 を中心に、
- 期待度数とは何か
- どうやって求めるか
- χ²値にどうつながるか
- よくあるミス
を整理します。
この記事で分かること
- 期待度数の意味
- 独立性の検定での期待度数の求め方
- 観測度数との違い
- χ²統計量の考え方
- 統計検定2級での典型問題の流れ
期待度数とは?
期待度数とは、
「もし帰無仮説が正しいなら、このセルにどれくらい入るはずか」
という理論上の度数です。
つまり、
- 実際に観測された数 → 観測度数
- 帰無仮説のもとで期待される数 → 期待度数
です。
χ²検定では、この 観測度数と期待度数のズレ を見ています。
独立性の検定では何を仮定する?
独立性の検定では、帰無仮説は通常こうです。
H0:2つの属性は独立である
たとえば
- 性別と商品の好み
- 学科と志望進路
- 地域と支持政党
などの組み合わせで、「独立である」と仮定したとき、各セルに入る人数を計算するのが期待度数です。
期待度数の求め方
独立性の検定では、各セルの期待度数は次で求めます。
期待度数 =(その行の合計)×(その列の合計)÷ 総数
これが最重要公式です。
問題(類似問題)
ある学校で、性別と部活動の所属について調べたところ、次の結果が得られた。
| 運動部 | 文化部 | 合計 | |
|---|---|---|---|
| 男子 | 40 | 20 | 60 |
| 女子 | 30 | 30 | 60 |
| 合計 | 70 | 50 | 120 |
問1:男子×運動部 の期待度数はいくらか。
解答
35
解説
男子×運動部 の期待度数は、
(男子の合計)×(運動部の合計)÷ 総数
= 60 × 70 ÷ 120
= 35
です。
つまり、もし「性別と部活動が独立」であれば、
男子で運動部に所属する人数は 35人程度 と期待されます。
他のセルも求めてみる
同じように計算すると、
- 男子×文化部
60 × 50 ÷ 120 = 25
- 女子×運動部
60 × 70 ÷ 120 = 35
- 女子×文化部
60 × 50 ÷ 120 = 25
したがって期待度数表はこうなります。
| 運動部 | 文化部 | |
|---|---|---|
| 男子 | 35 | 25 |
| 女子 | 35 | 25 |
なぜこの式になるのか
ここは感覚で理解すると忘れにくいです。
独立であるとは、
- 男子か女子か
- 運動部か文化部か
が互いに影響しない、ということです。
このとき、
- 男子の割合 = 60 / 120 = 0.5
- 運動部の割合 = 70 / 120
なので、独立なら
「男子かつ運動部」の割合は
0.5 × (70/120)
になります。
それを全体人数120人に戻すと、
120 × 0.5 × (70/120) = 60 × 70 ÷ 120
となります。
つまり、行割合と列割合を掛け合わせているイメージです。
χ²統計量はどう作る?
χ²検定では、各セルについて
(観測度数 − 期待度数)² ÷ 期待度数
を計算し、それらを全部足します。
今回の例では、
- 男子×運動部
(40 - 35)² / 35
- 男子×文化部
(20 - 25)² / 25
- 女子×運動部
(30 - 35)² / 35
- 女子×文化部
(30 - 25)² / 25
を足し合わせて χ²値を求めます。
問題(類似問題②)
次のうち、独立性の検定における期待度数の求め方として正しいものはどれか。
A. 行合計 + 列合計
B. 行合計 × 列合計
C. 行合計 × 列合計 ÷ 総数
D. 観測度数の平均との差
解答
C
解説
独立性の検定では、期待度数は
(行合計)×(列合計)÷総数
で求めます。
これが基本公式です。
自由度はどうなる?
独立性の検定の自由度は、
(行数 − 1)×(列数 − 1)
です。
今回の例は 2行×2列 なので、
(2 - 1) × (2 - 1) = 1
となり、自由度は 1 です。
よくあるミス
- 期待度数と観測度数を混同する
→ 実際の人数が観測度数、独立を仮定したときの理論値が期待度数です。 - 掛け算しただけで終わってしまう
→ 必ず 総数で割る 必要があります。 - χ²値の分母に観測度数を入れてしまう
→ 分母は 期待度数 です。 - 自由度を行数×列数にしてしまう
→ 自由度は (行数−1)(列数−1) です。
追加練習
問1
あるクロス表で、あるセルの行合計が40、列合計が30、総数が120である。
このセルの期待度数を求めてください。
解答
40 × 30 ÷ 120 = 10
問2
3行4列のクロス表で独立性の検定を行うとき、自由度はいくつか。
解答
(3 - 1) × (4 - 1) = 6
まとめ
- 期待度数は、帰無仮説が正しいときに期待される度数
- 独立性の検定では
期待度数 = 行合計 × 列合計 ÷ 総数
- χ²値は
(観測度数 − 期待度数)² ÷ 期待度数
を全セルで足して求める
- 自由度は
(行数−1)(列数−1)
次に読む記事
練習問題(noteの記事へ)
関連する問題をまとめて練習したい方へ:
統計検定2級「検定・推定」ドリル10問+解説


コメント