t検定の自由度はなぜ n−1?標本分散との関係を1本で理解【統計検定2級】

検定

統計検定2級で頻出の「t検定」

計算はできても、自由度がなぜ n−1 なのかが曖昧なままだと、区間推定や分散分析の理解までグラつきます。
この記事では、“なぜn−1なのか” を「式」と「直感(情報が1つ減る)」の両方で整理し、試験で迷わない状態にします。


この記事で分かること

  • t検定で自由度が n−1 になる理由
  • 標本平均を推定した分だけ、分散の自由度が1つ減るという意味
  • 統計検定2級での典型パターン(1標本/2標本/対応あり)の自由度の扱いの基本

問題(類似問題)

ある工程で作られた製品の長さについて、母分散は未知とする。無作為に n=12 個を抽出して平均を調べ、母平均がある基準値 μ₀ と等しいかを検定したい。

問1:このとき、検定統計量が従う t 分布の自由度はいくつか。
A. 10 B. 11 C. 12 D. 13


解答

B. 11(= n−1 = 12−1)


解説:自由度がn−1になる「結論」

t検定では、母分散 σ² が未知なので、σ² の代わりに 標本分散 s² を使います。
この s² を計算するとき、標本平均 xˉ\bar{x}を推定に使っているため、独立に動かせる情報(自由度)が 1つ減り、n−1 になります。


解説:式で確認(重要ポイントだけ)

標本分散は次の形です。s2=1n1i=1n(xixˉ)2s^2=\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x})^2

ポイントは (xixˉ)(x_i-\bar{x})の和に制約があることです。i=1n(xixˉ)=0\sum_{i=1}^{n}(x_i-\bar{x})=0

つまり、平均との差の n 個の値は 好き勝手にn個選べない
たとえば最初の n1n-1個の差を決めたら、最後の1個は「和が0になるように」自動的に決まります。
この「最後の1個は自由に決められない」= 自由度が1減るn−1 です。


解説:直感で覚える(試験で効く)

  • 平均 xˉ\bar{x}データから推定してしまう
  • その推定のせいで、データの“残りのばらつき”は 1つ分だけ自由が減る

覚え方:

「母分散未知 → 標本分散を使う → 平均を推定した分だけ1減る → 自由度 n−1」


統計検定2級での“自由度”の整理(最小限)

ここを混ぜると点が取れます。

1標本t検定(母平均)

  • 自由度:n−1

対応のあるt検定(差を取って1標本にする)

対応のある = 1か月前の体重と現在の体重のようなイメージ(比較している人(サンプル)は同じ)

  • ペア数を n とすると、差 did_iを作って 1標本t検定
  • 自由度:n−1

2標本t検定(独立2群)

ここは流派(等分散仮定かどうか)で変わります。試験では多くの場合、問題文にヒントが出ます。

  • 等分散を仮定する場合(プールした分散):自由度 n₁+n₂−2
  • 等分散を仮定しない場合(Welch):自由度は近似式(指定があるときのみ)

※最初は「1標本=n−1」「2標本(等分散)=n1+n2−2」だけ確実に。


よくあるミス(ここが得点源)

  1. nとn−1を取り違える
     母分散未知で s を使うなら基本は n−1(1標本の場合)。
  2. 「標本数が大きいから正規でいい」と雑に判断する
     σ未知で推定している限り、厳密には t。大標本では近似的に正規でも問題ないケースはあるが、設問に従う。
  3. 2標本なのに n−1 を使ってしまう
     独立2群(等分散仮定)の基本は n1+n2−2

追加練習(もう1問)

独立な2群の平均差について検定する。母分散は未知だが 2群の母分散は等しいと仮定できる。
標本サイズは n1=8n_1=8n2=10n_2=10

問2:このときの自由度は?
解答8+102=168+10-2=16


まとめ

  • 自由度が n−1 になる理由は、平均との差の合計が0になる制約があるから
  • 直感的には、平均をデータから推定した分だけ自由が1つ減る
  • 1標本・対応ありは n−1、2標本(等分散)は n1+n2−2 が基本

次に読むおすすめ


note演習問題

同じ型の問題をまとめて練習したい方へ:
統計検定2級「検定」ドリル10問+解説

コメント

タイトルとURLをコピーしました