相関係数の検定とは?無相関の検定をわかりやすく解説【統計検定2級】

回帰・相関

2変数の関係を見るとき、まず思い浮かぶのが 相関係数 です。
ただ、相関係数を計算しただけでは、

  • 本当に関係があるのか
  • たまたまそう見えただけなのか
  • 標本の偶然ではないのか

までは分かりません。

そこで使うのが 相関係数の検定 です。

統計検定2級では、

  • 帰無仮説は何か
  • 何を検定しているのか
  • 有意な相関とはどういう意味か

が問われやすいです。


この記事で分かること

  • 相関係数の検定が何を調べる検定か
  • 帰無仮説と対立仮説
  • 検定統計量の考え方
  • 有意な相関の意味
  • よくある誤解

相関係数の検定とは?

相関係数の検定は、

母相関係数が 0 かどうか

を調べる検定です。

つまり、標本で見えている相関が、

  • 本当に母集団にもあるのか
  • それとも標本の偶然なのか

を判断します。


帰無仮説と対立仮説

相関係数の検定では、通常

  • H0:母相関係数 r=0
  • H1:母相関係数 r≠0

とします。

これは、
「母集団では無相関である」
という帰無仮説を棄却できるか、という形です。


「相関係数が大きい」だけでは不十分

ここが大事です。

たとえば標本相関係数 r=0.6r = 0.6だったとしても、

  • 標本数が非常に小さいなら偶然かもしれない
  • 標本数が大きければ有意になりやすい

という違いがあります。

つまり、相関係数の大きさだけでは足りず、標本サイズも必要です。


問題1

ある2変数 X,YX, YX,Y について、標本相関係数を求めたところ r=0.58r = 0.58 であった。
この結果について、最も適切な説明はどれか。
A. これだけで母集団でも必ず相関があると言える
B. これだけで回帰式が有意だと言える
C. 標本数も考えないと、相関が有意かどうかは判断できない
D. 相関係数が正なので、因果関係があると言える


解答

C


解説

標本相関係数 rrが 0.58 でも、

  • 標本数が少なければ偶然の可能性がある
  • 標本数が多ければ有意になる可能性が高い

ので、相関係数の値だけでは有意性は判断できません。

また、

  • 相関がある → 因果関係がある
    ではありません。

検定統計量

母相関係数r=0を検定するとき、検定統計量は次です。

t = r √(n - 2) / √(1 - r²)

この統計量は、帰無仮説のもとで 自由度 n−2 の t分布 に従います。


自由度が n−2 になる理由

相関係数の検定では、自由度は

n - 2

です。

これは、2変数の関係を直線で表すときに、実質的に2つ分の情報を使っているためです。
統計検定2級では、まずは

相関係数の検定の自由度は n−2

と押さえておけば十分です。


問題2

標本数 n=12n = 12、標本相関係数 r=0.50r = 0.50のとき、相関係数の検定で使う自由度はいくつか。
A. 10
B. 11
C. 12
D. 9


解答

A


解説

相関係数の検定では自由度は

n - 2

なので、

12 - 2 = 10

です。


有意な相関とはどういう意味か

相関係数の検定で有意になるというのは、

母集団で無相関とは考えにくい

という意味です。

ただし、これは

  • 因果関係がある
  • 強い関係がある
  • 実務的に重要である

ことまで保証するものではありません。


問題3

相関係数の検定で帰無仮説が棄却されたとき、最も適切な解釈はどれか。
A. 2変数の間に因果関係がある
B. 母相関係数は 0 ではないと考えられる
C. 相関係数は必ず 1 に近い
D. 直線関係が完全に成立している


解答

B


解説

帰無仮説が棄却されたときに言えるのは、

母相関係数は 0 ではないと考えられる

ということです。

ただし、

  • 因果関係
  • 完全な直線関係
  • 非常に強い関係

までは言えません。


単回帰との関係

相関係数の検定は、単回帰とも深くつながっています。

単回帰では、

  • 傾きの t検定
  • 相関係数の検定

が本質的に同じ意味を持ちます。

つまり、

  • 相関係数が有意
  • 回帰直線の傾きが有意

です。

ここは統計検定2級でもよく問われます。


相関係数が高くても有意でないことはある?

あります。
特に 標本数が少ないとき は起こります。

逆に、相関係数がそれほど大きくなくても、標本数が非常に大きければ有意 になることもあります。

つまり、相関の検定では

  • 相関の大きさ
  • 標本サイズ

の両方が重要です。


よくあるミス

  1. 相関係数が大きい = 必ず有意、と思ってしまう
    → 標本数も必要です。
  2. 有意な相関 = 因果関係あり、と思ってしまう
    → 相関と因果は別です。
  3. 有意 = 強い相関、と決めつける
    → 有意性と強さは別です。
  4. 自由度を n−1 としてしまう
    → 相関係数の検定では n−2 です。

追加練習

ある2変量データについて、標本数 n=12n=12、標本相関係数 r=0.60r=0.60 であった。
母相関係数 ρ=0\rho=0 を帰無仮説として、有意水準5%の両側検定を行う。
検定統計量 ttと結論の組として最も適切なものを、次の 1〜4 のうちから1つ選べ。

  1. t1.88t \approx 1.88 であり、帰無仮説は棄却できない
  2. t2.37t \approx 2.37 であり、帰無仮説は棄却する
  3. t2.37t \approx 2.37 であり、帰無仮説は棄却できない
  4. t3.00t \approx 3.00 であり、帰無仮説は棄却する

解答

2

解説

相関係数の検定では、検定統計量は

t = r√(n-2) / √(1-r²)

で与えられ、自由度は

n - 2

である。

今回は

n = 12, r = 0.60

なので、

t = 0.60√10 / √(1-0.36)
= 0.60√10 / √0.64
= 0.60×3.162 / 0.8
≈ 1.897 / 0.8
≈ 2.37

したがって、検定統計量は

t ≈ 2.37

となる。

自由度は

12 - 2 = 10

である。
有意水準5%の両側検定では、t分布表より自由度10、上側確率0.025の臨界値は約

2.228

である。

したがって

|t| = 2.37 > 2.228

より、帰無仮説 H0:ρ=0H_0:\rho=0 は棄却される。
つまり、母相関係数は 0 ではないと考えられる

よって正解は 2


まとめ

  • 相関係数の検定は、母相関係数が0かどうか を調べる
  • 帰無仮説は
H0: r = 0
  • 検定統計量は t分布に従い、自由度は
n - 2
  • 有意でも、因果関係まで言えるわけではない
  • 単回帰の傾きの検定と深くつながっている

次に読む記事


練習問題(noteの記事へ)

関連する問題をまとめて練習したい方へ:
統計検定2級問題演習ドリル10問+解説

コメント

タイトルとURLをコピーしました