コンテンツにスキップ

第5部:統計的推定 解答

第12回:区間推定(分散既知の場合の平均の推定)

1. 基本的な理解を確認する問題

(1) 信頼区間の意味を説明し、信頼係数との関係を述べよ。

解答: 信頼区間とは、母集団のパラメータ(例:平均値μ)の真の値が含まれると推測される区間です。

解説: 1. 信頼区間の定義: - 母数θの100(1-α)%信頼区間[L, U]は: $$ \mathbb{P}(L \leq \theta \leq U) = 1-\alpha $$ - ここで、LとUは標本に依存する確率変数 - θは固定値(母数)

  1. 信頼係数との関係:
  2. 信頼係数1-αは、長期的にこの区間が母数を含む確率
  3. 例えば、95%信頼区間の場合:

    • α = 0.05
    • 同じ実験を100回繰り返すと、約95回は真の母数を含む区間が得られる
  4. 重要なポイント:

  5. 信頼区間は確率変数
  6. 母数は固定値
  7. 信頼係数は「区間が母数を含む確率」

(2) 標本サイズと信頼区間の幅の関係を説明せよ。

解答: 信頼区間の幅は標本サイズの平方根に反比例します。

解説: 1. 信頼区間の幅の式: $$ w = 2z_{\alpha/2}\frac{\sigma}{\sqrt{n}} $$

  1. 標本サイズとの関係:
  2. 幅は\(\frac{1}{\sqrt{n}}\)に比例
  3. 標本サイズが4倍になると、幅は1/2倍
  4. 標本サイズが9倍になると、幅は1/3倍

  5. 実践的な意味:

  6. より正確な推定には、より大きな標本サイズが必要
  7. ただし、標本サイズを増やすにはコストがかかる
  8. 必要な精度とコストのバランスを考慮する必要がある

(3) 母分散が既知の場合の平均の区間推定の手順を説明せよ。

解答: 以下の手順で母平均の区間推定を行います:

  1. 標本平均の計算: $$ \bar{X} = \frac{1}{n}\sum_{i=1}^n X_i $$

  2. 信頼区間の計算: $$ \left[\bar{X} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}}, \bar{X} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right] $$ ここで:

  3. \(z_{\alpha/2}\):標準正規分布の上側α/2点
  4. σ:母標準偏差(既知)
  5. n:標本サイズ

  6. 結果の解釈:

  7. この区間は、真の母平均を含む確率が1-α
  8. 区間の幅は推定の精度を示す

2. 計算問題

ある製品の重量が正規分布\(N(\mu, 25)\)に従うとする。16個の製品を測定したところ、平均が498gであった。母平均\(\mu\)の95%信頼区間は \(\text{(a)} \leq \mu \leq \text{(b)}\) である。

解答: (a) = 495.55, (b) = 500.45

解説: 1. 与えられた情報: - 標本平均\(\bar{X} = 498\)g - 母分散\(\sigma^2 = 25\)g²(母標準偏差\(\sigma = 5\)g) - 標本サイズ\(n = 16\) - 信頼係数95%(\(z_{0.025} = 1.96\)

  1. 正規分布を使用する理由:
  2. 母集団が正規分布\(N(\mu, 25)\)に従う
  3. 標本平均\(\bar{X}\)も正規分布\(N(\mu, \frac{25}{16})\)に従う
  4. 母分散が既知(\(\sigma^2 = 25\))であるため、標準正規分布の分位点\(z_{\alpha/2}\)を使用

  5. 信頼区間の計算: $$ \bar{X} \pm z_{0.025}\frac{\sigma}{\sqrt{n}} = 498 \pm 1.96\frac{5}{\sqrt{16}} = 498 \pm 2.45 $$

  6. したがって、信頼区間は: [498 - 2.45, 498 + 2.45] = [495.55, 500.45]

補足: - この区間は、真の母平均が含まれる確率が95%であることを示します - 区間の幅は約4.9gです - 母分散が既知であるため、t分布ではなく標準正規分布の分位点を使用しています

3. 実践的な問題

ある工場で製造される製品の重量が正規分布\(N(\mu, 16)\)に従うとする。規格値は500g±10gである。以下のデータが得られた:

  • 標本サイズ:25個
  • 標本平均:495g

解答:

  1. 母平均の95%信頼区間: [492.43g, 497.57g]

解説: 1. 与えられた情報: - 標本平均\(\bar{X} = 495\)g - 母分散\(\sigma^2 = 16\)g²(母標準偏差\(\sigma = 4\)g) - 標本サイズ\(n = 25\) - 信頼係数95%(\(z_{0.025} = 1.96\)

  1. 信頼区間の計算: $$ \bar{X} \pm z_{0.025}\frac{\sigma}{\sqrt{n}} = 495 \pm 1.96\frac{4}{\sqrt{25}} = 495 \pm 1.568 $$

  2. したがって、信頼区間は: [495 - 1.568, 495 + 1.568] = [492.43, 497.57]

  3. 信頼区間の幅を半分にするには、標本サイズを4倍にする必要があります。

解説: 1. 現在の標本サイズ:25個 2. 必要な標本サイズ:100個(25 × 4)

  1. 規格値(500g±10g)は信頼区間[492.43g, 497.57g]に含まれていません。

解説: 1. 規格値の範囲:490g~510g 2. 信頼区間:492.43g~497.57g 3. 信頼区間は規格値の範囲内に完全に含まれています 4. これは、製品の平均重量が規格を満たしていることを示唆しています

第13回:区間推定(分散未知の場合の平均の推定)

4. 基本的な理解を確認する問題

(1) 分散未知の場合の平均の区間推定の特徴を説明せよ。

解答: 分散未知の場合の平均の区間推定には、以下の特徴があります:

  1. t分布の使用:
  2. 母分散が未知のため、標本標準偏差を使用
  3. これにより、t分布を用いた区間推定が必要

  4. 信頼区間の式: $$ \left[\bar{X} - t_{\alpha/2}(n-1)\frac{s}{\sqrt{n}}, \bar{X} + t_{\alpha/2}(n-1)\frac{s}{\sqrt{n}}\right] $$ ここで:

  5. \(t_{\alpha/2}(n-1)\):自由度n-1のt分布の上側α/2点
  6. s:標本標準偏差
  7. n:標本サイズ

  8. 特徴:

  9. 標本サイズが小さい場合、正規分布より広い区間
  10. 標本サイズが大きい場合(n > 30)、正規分布に近づく
  11. 不確実性が大きいため、より保守的な推定

(2) t分布の特徴と、正規分布との違いを説明せよ。

解答: t分布の主な特徴と正規分布との違いは以下の通りです:

  1. 形状の特徴:
  2. 正規分布より裾が厚い(重い)
  3. 自由度が小さいほど裾が厚い
  4. 自由度が大きくなるにつれて正規分布に近づく

  5. 数値的な特徴:

  6. 期待値:0(自由度 > 1)
  7. 分散:\(\frac{k}{k-2}\)(自由度k > 2)
  8. 正規分布より分散が大きい

  9. 正規分布との主な違い:

  10. 裾の厚さ:t分布の方が厚い
  11. 分散:t分布の方が大きい
  12. 収束性:自由度→∞で正規分布に収束

(3) 標本サイズが大きい場合のt分布の性質を説明せよ。

解答: 標本サイズが大きい場合(n > 30)、t分布は以下の性質を示します:

  1. 正規分布への収束:
  2. 自由度が大きくなるにつれて
  3. t分布は標準正規分布に近づく
  4. 実用上はn > 30で正規分布で近似可能

  5. 数値的な特徴:

  6. t分布の分位点は正規分布の分位点に近づく
  7. 例えば、95%信頼区間の場合:

    • n = 30:t_{0.025}(29) ≈ 2.045
    • n = ∞:z_{0.025} = 1.96
  8. 実践的な意味:

  9. 大標本では正規分布による近似が可能
  10. 計算が簡略化できる
  11. ただし、厳密にはt分布を使用する方が正確

5. 計算問題

ある製品の重量が正規分布に従うとする。9個の製品を測定したところ、平均が498g、標準偏差が5gであった。母平均\(\mu\)の95%信頼区間は \(\text{(c)} \leq \mu \leq \text{(d)}\) である。

解答: (c) = 494.33, (d) = 501.67

解説: 1. 与えられた情報: - 標本平均\(\bar{X} = 498\)g - 標本標準偏差\(s = 5\)g - 標本サイズ\(n = 9\) - 信頼係数95%(\(t_{0.025}(8) = 2.306\)

  1. 信頼区間の計算: $$ \bar{X} \pm t_{0.025}(8)\frac{s}{\sqrt{n}} = 498 \pm 2.306\frac{5}{\sqrt{9}} = 498 \pm 3.843 $$

  2. したがって、信頼区間は: [498 - 3.843, 498 + 3.843] = [494.33, 501.67]

補足: - この区間は、真の母平均が含まれる確率が95%であることを示します - 区間の幅は約7.69gです - 分散既知の場合と比べて、区間が広くなっています

6. 実践的な問題

ある試験の得点が正規分布に従うとする。100人の学生の標本平均が65点、標本標準偏差が10点であった。

解答:

  1. 母平均の95%信頼区間: [63.04点, 66.96点]

解説: 1. 与えられた情報: - 標本平均\(\bar{X} = 65\)点 - 標本標準偏差\(s = 10\)点 - 標本サイズ\(n = 100\) - 信頼係数95%(\(t_{0.025}(99) ≈ 1.984\)

  1. 信頼区間の計算: $$ \bar{X} \pm t_{0.025}(99)\frac{s}{\sqrt{n}} = 65 \pm 1.984\frac{10}{\sqrt{100}} = 65 \pm 1.984 $$

  2. したがって、信頼区間は: [65 - 1.984, 65 + 1.984] = [63.04, 66.96]

  3. 信頼区間の幅を半分にするには、標本サイズを4倍にする必要があります。

解説: 1. 現在の標本サイズ:100人 2. 必要な標本サイズ:400人(100 × 4)

  1. 全国平均が70点であるという仮説の検定:

解答: 帰無仮説\(H_0: \mu = 70\)は棄却されます。

解説: 1. 検定統計量の計算: $$ t = \frac{\bar{X} - \mu_0}{s/\sqrt{n}} = \frac{65 - 70}{10/\sqrt{100}} = -5 $$

  1. 棄却域の決定:
  2. 有意水準5%
  3. 両側検定
  4. 棄却域:\(|t| > 1.984\)

  5. 判定:

  6. \(|t| = 5 > 1.984\)
  7. したがって、帰無仮説を棄却
  8. 全国平均は70点と異なると結論

補足: - この結果は、標本の平均が全国平均より有意に低いことを示しています - 教育上の介入や対策を検討する必要があるかもしれません