回帰分析のF検定とは?回帰式全体の有意性をわかりやすく解説【統計検定2級】

回帰・相関

回帰分析の結果を見ると、よく F値有意F という項目が出てきます。

ここで多くの人が混乱するのが、

  • t検定とF検定は何が違うのか
  • F検定では何を調べているのか
  • F値が有意だと何が言えるのか

という点です。

回帰分析のF検定は、
回帰式全体が意味を持っているか
を調べるための検定です。

この記事では、

  • 回帰分析のF検定が何を見ているのか
  • t検定との違い
  • 帰無仮説と対立仮説
  • よくあるミス

を整理します。


この記事で分かること

  • 回帰分析のF検定とは何か
  • F検定とt検定の違い
  • 回帰式全体の有意性とは何か
  • F値が大きいと何を意味するか
  • 統計検定2級での基本的な読み方

回帰分析のF検定とは?

回帰分析のF検定は、

説明変数全体として、目的変数の説明に役立っているか

を調べる検定です。

たとえば単回帰なら、

  • 説明変数 xx
  • 目的変数 yyの説明に意味を持つか

を見ています。

重回帰なら、

  • 複数の説明変数をまとめて見たときに
  • 回帰式全体が有意か

を見ます。


帰無仮説と対立仮説

回帰分析のF検定では、基本的に

  • H0:回帰係数はすべて 0
  • H1:少なくとも1つの回帰係数は 0 ではない

と考えます。

単回帰なら、これは

  • H0:傾き = 0
  • H1:傾き ≠ 0

とほぼ同じ意味です。

重回帰では、
「全部の説明変数がまったく効いていない」
という帰無仮説を立てて、それを棄却できるかを見ます。


「回帰式全体が有意」とはどういうことか

F検定で有意になるということは、

説明変数を使ったモデルの方が、何も使わないモデルよりも説明力がある

という意味です。

言い換えると、

  • 回帰式を作る意味がある
  • 少なくとも何かしらの説明変数が効いていそう

ということです。


t検定との違い

ここは非常に重要です。

検定 何を見るか 単回帰/重回帰での意味
t検定 個々の係数が有意か この説明変数1つが効くか
F検定 回帰式全体が有意か モデル全体として意味があるか

つまり、

  • t検定:個別の説明変数
  • F検定:モデル全体

を見る、という違いがあります。


単回帰ではF検定とt検定がほぼ同じ意味になる

単回帰では説明変数が1つだけなので、

  • 回帰式全体が有意か
  • その説明変数の係数が有意か

はほぼ同じ意味になります。

実際、単回帰では

F = t²

という関係があります。

つまり、単回帰では F検定と t検定は一致します。


重回帰では意味が分かれる

重回帰では、説明変数が複数あるので、

  • F検定:全体として意味があるか
  • t検定:各説明変数が個別に意味があるか

が分かれます。

そのため、

  • F検定は有意
  • でも、ある説明変数の t検定は有意でない

ということも普通に起こります。


問題(類似問題①)

回帰分析のF検定で有意だったとき、最も適切に言えることはどれか。
A. すべての説明変数が有意である
B. 少なくとも1つの説明変数は目的変数の説明に役立っている可能性が高い
C. 切片は0である
D. 決定係数は必ず1である


解答

B


解説

F検定で有意なのは、

回帰式全体として意味がある

ということです。

ただし、

  • すべての説明変数が有意
  • どの説明変数が有意

までは、この結果だけでは分かりません。


F値は何を比べているのか

回帰分析のF値は、考え方としては

モデルで説明できる変動

誤差として残る変動

の比を見ています。

つまり、

  • 説明できた部分が大きい
  • 残差が小さい

ほど F値は大きくなります。

F値が大きいほど、
「この回帰式は何も説明していないモデルより良さそう」
と考えます。


分散分析とのつながり

前回の記事で見た分散分析と、回帰分析のF検定はかなり近い考え方です。

どちらも、

説明される変動

説明されない変動

の比を見ています。

そのため、回帰分析の結果表にも ANOVA 表が出てくることがあります。


問題(類似問題②)

重回帰分析で F検定が有意、しかしある説明変数の t検定は有意でなかった。
このときの解釈として最も適切なのはどれか。
A. 回帰式全体には意味があるが、その説明変数は個別には有意とは言えない
B. F検定は必ず間違っている
C. すべての説明変数が有意である
D. 決定係数は0である


解答

A


解説

重回帰では、

  • F検定:モデル全体
  • t検定:各説明変数

を別々に見ます。

したがって、

  • モデル全体としては有意
  • でも個別には有意でない変数がある

ということは普通に起こります。


回帰出力でどこを見ればよいか

統計ソフトや表計算ソフトでは、回帰分析の結果に

  • F
  • 有意F
  • Significance F

などの項目が出ます。

ここでは

  • F:検定統計量
  • 有意F:そのF値に対応する p値

と考えればOKです。

したがって、

  • 有意F が 0.05 未満
  • または p値 が 0.05 未満

なら、5%有意水準で
回帰式全体は有意
と判断します。


よくあるミス

  1. F検定が有意なら、全部の説明変数が有意だと思ってしまう
    → それは言えません。全体として意味があるだけです。
  2. t検定とF検定を同じものと思ってしまう
    → 単回帰では近いですが、重回帰では役割が違います。
  3. F値そのものだけ見て判断する
    → 自由度や p値 とあわせて見る必要があります。
  4. F検定で有意でない = どの変数も絶対に関係ない、と断定してしまう
    → 標本サイズや誤差の影響もあるので、断定ではなく「十分な証拠がない」と考えます。


まとめ

  • 回帰分析のF検定は、回帰式全体が有意か を調べる
  • 帰無仮説は
    「回帰係数はすべて0」
  • t検定は個々の係数、F検定はモデル全体
  • 単回帰では F = t² の関係がある
  • 重回帰では、F検定と t検定の意味は分かれる

次に読む記事


練習問題(noteの記事へ)

関連する問題をまとめて練習したい方へ:
統計検定2級問題演習ドリル10問+解説

コメント

タイトルとURLをコピーしました