回帰分析の結果を見ると、よく F値 や 有意F という項目が出てきます。
ここで多くの人が混乱するのが、
- t検定とF検定は何が違うのか
- F検定では何を調べているのか
- F値が有意だと何が言えるのか
という点です。
回帰分析のF検定は、
回帰式全体が意味を持っているか
を調べるための検定です。
この記事では、
- 回帰分析のF検定が何を見ているのか
- t検定との違い
- 帰無仮説と対立仮説
- よくあるミス
を整理します。
この記事で分かること
- 回帰分析のF検定とは何か
- F検定とt検定の違い
- 回帰式全体の有意性とは何か
- F値が大きいと何を意味するか
- 統計検定2級での基本的な読み方
回帰分析のF検定とは?
回帰分析のF検定は、
説明変数全体として、目的変数の説明に役立っているか
を調べる検定です。
たとえば単回帰なら、
- 説明変数 が
- 目的変数 の説明に意味を持つか
を見ています。
重回帰なら、
- 複数の説明変数をまとめて見たときに
- 回帰式全体が有意か
を見ます。
帰無仮説と対立仮説
回帰分析のF検定では、基本的に
- H0:回帰係数はすべて 0
- H1:少なくとも1つの回帰係数は 0 ではない
と考えます。
単回帰なら、これは
- H0:傾き = 0
- H1:傾き ≠ 0
とほぼ同じ意味です。
重回帰では、
「全部の説明変数がまったく効いていない」
という帰無仮説を立てて、それを棄却できるかを見ます。
「回帰式全体が有意」とはどういうことか
F検定で有意になるということは、
説明変数を使ったモデルの方が、何も使わないモデルよりも説明力がある
という意味です。
言い換えると、
- 回帰式を作る意味がある
- 少なくとも何かしらの説明変数が効いていそう
ということです。
t検定との違い
ここは非常に重要です。
| 検定 | 何を見るか | 単回帰/重回帰での意味 |
|---|---|---|
| t検定 | 個々の係数が有意か | この説明変数1つが効くか |
| F検定 | 回帰式全体が有意か | モデル全体として意味があるか |
つまり、
- t検定:個別の説明変数
- F検定:モデル全体
を見る、という違いがあります。
単回帰ではF検定とt検定がほぼ同じ意味になる
単回帰では説明変数が1つだけなので、
- 回帰式全体が有意か
- その説明変数の係数が有意か
はほぼ同じ意味になります。
実際、単回帰では
F = t²
という関係があります。
つまり、単回帰では F検定と t検定は一致します。
重回帰では意味が分かれる
重回帰では、説明変数が複数あるので、
- F検定:全体として意味があるか
- t検定:各説明変数が個別に意味があるか
が分かれます。
そのため、
- F検定は有意
- でも、ある説明変数の t検定は有意でない
ということも普通に起こります。
問題(類似問題①)
回帰分析のF検定で有意だったとき、最も適切に言えることはどれか。
A. すべての説明変数が有意である
B. 少なくとも1つの説明変数は目的変数の説明に役立っている可能性が高い
C. 切片は0である
D. 決定係数は必ず1である
解答
B
解説
F検定で有意なのは、
回帰式全体として意味がある
ということです。
ただし、
- すべての説明変数が有意
- どの説明変数が有意
までは、この結果だけでは分かりません。
F値は何を比べているのか
回帰分析のF値は、考え方としては
モデルで説明できる変動
と
誤差として残る変動
の比を見ています。
つまり、
- 説明できた部分が大きい
- 残差が小さい
ほど F値は大きくなります。
F値が大きいほど、
「この回帰式は何も説明していないモデルより良さそう」
と考えます。
分散分析とのつながり
前回の記事で見た分散分析と、回帰分析のF検定はかなり近い考え方です。
どちらも、
説明される変動
と
説明されない変動
の比を見ています。
そのため、回帰分析の結果表にも ANOVA 表が出てくることがあります。
問題(類似問題②)
重回帰分析で F検定が有意、しかしある説明変数の t検定は有意でなかった。
このときの解釈として最も適切なのはどれか。
A. 回帰式全体には意味があるが、その説明変数は個別には有意とは言えない
B. F検定は必ず間違っている
C. すべての説明変数が有意である
D. 決定係数は0である
解答
A
解説
重回帰では、
- F検定:モデル全体
- t検定:各説明変数
を別々に見ます。
したがって、
- モデル全体としては有意
- でも個別には有意でない変数がある
ということは普通に起こります。
回帰出力でどこを見ればよいか
統計ソフトや表計算ソフトでは、回帰分析の結果に
- F
- 有意F
- Significance F
などの項目が出ます。
ここでは
- F:検定統計量
- 有意F:そのF値に対応する p値
と考えればOKです。
したがって、
- 有意F が 0.05 未満
- または p値 が 0.05 未満
なら、5%有意水準で
回帰式全体は有意
と判断します。
よくあるミス
- F検定が有意なら、全部の説明変数が有意だと思ってしまう
→ それは言えません。全体として意味があるだけです。 - t検定とF検定を同じものと思ってしまう
→ 単回帰では近いですが、重回帰では役割が違います。 - F値そのものだけ見て判断する
→ 自由度や p値 とあわせて見る必要があります。 - F検定で有意でない = どの変数も絶対に関係ない、と断定してしまう
→ 標本サイズや誤差の影響もあるので、断定ではなく「十分な証拠がない」と考えます。
まとめ
- 回帰分析のF検定は、回帰式全体が有意か を調べる
- 帰無仮説は
「回帰係数はすべて0」 - t検定は個々の係数、F検定はモデル全体
- 単回帰では F = t² の関係がある
- 重回帰では、F検定と t検定の意味は分かれる
次に読む記事
練習問題(noteの記事へ)
関連する問題をまとめて練習したい方へ:
統計検定2級問題演習ドリル10問+解説


コメント