2変数の関係を見るとき、まず思い浮かぶのが 相関係数 です。
ただ、相関係数を計算しただけでは、
- 本当に関係があるのか
- たまたまそう見えただけなのか
- 標本の偶然ではないのか
までは分かりません。
そこで使うのが 相関係数の検定 です。
統計検定2級では、
- 帰無仮説は何か
- 何を検定しているのか
- 有意な相関とはどういう意味か
が問われやすいです。
この記事で分かること
- 相関係数の検定が何を調べる検定か
- 帰無仮説と対立仮説
- 検定統計量の考え方
- 有意な相関の意味
- よくある誤解
相関係数の検定とは?
相関係数の検定は、
母相関係数が 0 かどうか
を調べる検定です。
つまり、標本で見えている相関が、
- 本当に母集団にもあるのか
- それとも標本の偶然なのか
を判断します。
帰無仮説と対立仮説
相関係数の検定では、通常
- H0:母相関係数 r=0
- H1:母相関係数 r≠0
とします。
これは、
「母集団では無相関である」
という帰無仮説を棄却できるか、という形です。
「相関係数が大きい」だけでは不十分
ここが大事です。
たとえば標本相関係数 だったとしても、
- 標本数が非常に小さいなら偶然かもしれない
- 標本数が大きければ有意になりやすい
という違いがあります。
つまり、相関係数の大きさだけでは足りず、標本サイズも必要です。
問題1
ある2変数 X,Y について、標本相関係数を求めたところ であった。
この結果について、最も適切な説明はどれか。
A. これだけで母集団でも必ず相関があると言える
B. これだけで回帰式が有意だと言える
C. 標本数も考えないと、相関が有意かどうかは判断できない
D. 相関係数が正なので、因果関係があると言える
解答
C
解説
標本相関係数 が 0.58 でも、
- 標本数が少なければ偶然の可能性がある
- 標本数が多ければ有意になる可能性が高い
ので、相関係数の値だけでは有意性は判断できません。
また、
- 相関がある → 因果関係がある
ではありません。
検定統計量
母相関係数r=0を検定するとき、検定統計量は次です。
t = r √(n - 2) / √(1 - r²)
この統計量は、帰無仮説のもとで 自由度 n−2 の t分布 に従います。
自由度が n−2 になる理由
相関係数の検定では、自由度は
n - 2
です。
これは、2変数の関係を直線で表すときに、実質的に2つ分の情報を使っているためです。
統計検定2級では、まずは
相関係数の検定の自由度は n−2
と押さえておけば十分です。
問題2
標本数 、標本相関係数 のとき、相関係数の検定で使う自由度はいくつか。
A. 10
B. 11
C. 12
D. 9
解答
A
解説
相関係数の検定では自由度は
n - 2
なので、
12 - 2 = 10
です。
有意な相関とはどういう意味か
相関係数の検定で有意になるというのは、
母集団で無相関とは考えにくい
という意味です。
ただし、これは
- 因果関係がある
- 強い関係がある
- 実務的に重要である
ことまで保証するものではありません。
問題3
相関係数の検定で帰無仮説が棄却されたとき、最も適切な解釈はどれか。
A. 2変数の間に因果関係がある
B. 母相関係数は 0 ではないと考えられる
C. 相関係数は必ず 1 に近い
D. 直線関係が完全に成立している
解答
B
解説
帰無仮説が棄却されたときに言えるのは、
母相関係数は 0 ではないと考えられる
ということです。
ただし、
- 因果関係
- 完全な直線関係
- 非常に強い関係
までは言えません。
単回帰との関係
相関係数の検定は、単回帰とも深くつながっています。
単回帰では、
- 傾きの t検定
- 相関係数の検定
が本質的に同じ意味を持ちます。
つまり、
- 相関係数が有意
⇔ - 回帰直線の傾きが有意
です。
ここは統計検定2級でもよく問われます。
相関係数が高くても有意でないことはある?
あります。
特に 標本数が少ないとき は起こります。
逆に、相関係数がそれほど大きくなくても、標本数が非常に大きければ有意 になることもあります。
つまり、相関の検定では
- 相関の大きさ
- 標本サイズ
の両方が重要です。
よくあるミス
- 相関係数が大きい = 必ず有意、と思ってしまう
→ 標本数も必要です。 - 有意な相関 = 因果関係あり、と思ってしまう
→ 相関と因果は別です。 - 有意 = 強い相関、と決めつける
→ 有意性と強さは別です。 - 自由度を n−1 としてしまう
→ 相関係数の検定では n−2 です。
追加練習
ある2変量データについて、標本数 、標本相関係数 であった。
母相関係数 を帰無仮説として、有意水準5%の両側検定を行う。
検定統計量 と結論の組として最も適切なものを、次の 1〜4 のうちから1つ選べ。
- であり、帰無仮説は棄却できない
- であり、帰無仮説は棄却する
- であり、帰無仮説は棄却できない
- であり、帰無仮説は棄却する
解答
2
解説
相関係数の検定では、検定統計量は
t = r√(n-2) / √(1-r²)
で与えられ、自由度は
n - 2
である。
今回は
n = 12, r = 0.60
なので、
t = 0.60√10 / √(1-0.36)
= 0.60√10 / √0.64
= 0.60×3.162 / 0.8
≈ 1.897 / 0.8
≈ 2.37
したがって、検定統計量は
t ≈ 2.37
となる。
自由度は
12 - 2 = 10
である。
有意水準5%の両側検定では、t分布表より自由度10、上側確率0.025の臨界値は約
2.228
である。
したがって
|t| = 2.37 > 2.228
より、帰無仮説 は棄却される。
つまり、母相関係数は 0 ではないと考えられる。
よって正解は 2。
まとめ
- 相関係数の検定は、母相関係数が0かどうか を調べる
- 帰無仮説は
H0: r = 0
- 検定統計量は t分布に従い、自由度は
n - 2
- 有意でも、因果関係まで言えるわけではない
- 単回帰の傾きの検定と深くつながっている
次に読む記事
練習問題(noteの記事へ)
関連する問題をまとめて練習したい方へ:
統計検定2級問題演習ドリル10問+解説

コメント