第5部:統計的推定 解答
第12回:区間推定(分散既知の場合の平均の推定)
1. 基本的な理解を確認する問題
(1) 信頼区間の意味を説明し、信頼係数との関係を述べよ。
解答: 信頼区間とは、母集団のパラメータ(例:平均値μ)の真の値が含まれると推測される区間です。
解説: 1. 信頼区間の定義: - 母数θの100(1-α)%信頼区間[L, U]は: $$ \mathbb{P}(L \leq \theta \leq U) = 1-\alpha $$ - ここで、LとUは標本に依存する確率変数 - θは固定値(母数)
- 信頼係数との関係:
- 信頼係数1-αは、長期的にこの区間が母数を含む確率
-
例えば、95%信頼区間の場合:
- α = 0.05
- 同じ実験を100回繰り返すと、約95回は真の母数を含む区間が得られる
-
重要なポイント:
- 信頼区間は確率変数
- 母数は固定値
- 信頼係数は「区間が母数を含む確率」
(2) 標本サイズと信頼区間の幅の関係を説明せよ。
解答: 信頼区間の幅は標本サイズの平方根に反比例します。
解説: 1. 信頼区間の幅の式: $$ w = 2z_{\alpha/2}\frac{\sigma}{\sqrt{n}} $$
- 標本サイズとの関係:
- 幅は\(\frac{1}{\sqrt{n}}\)に比例
- 標本サイズが4倍になると、幅は1/2倍
-
標本サイズが9倍になると、幅は1/3倍
-
実践的な意味:
- より正確な推定には、より大きな標本サイズが必要
- ただし、標本サイズを増やすにはコストがかかる
- 必要な精度とコストのバランスを考慮する必要がある
(3) 母分散が既知の場合の平均の区間推定の手順を説明せよ。
解答: 以下の手順で母平均の区間推定を行います:
-
標本平均の計算: $$ \bar{X} = \frac{1}{n}\sum_{i=1}^n X_i $$
-
信頼区間の計算: $$ \left[\bar{X} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}}, \bar{X} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right] $$ ここで:
- \(z_{\alpha/2}\):標準正規分布の上側α/2点
- σ:母標準偏差(既知)
-
n:標本サイズ
-
結果の解釈:
- この区間は、真の母平均を含む確率が1-α
- 区間の幅は推定の精度を示す
2. 計算問題
ある製品の重量が正規分布\(N(\mu, 25)\)に従うとする。16個の製品を測定したところ、平均が498gであった。母平均\(\mu\)の95%信頼区間は \(\text{(a)} \leq \mu \leq \text{(b)}\) である。
解答: (a) = 495.55, (b) = 500.45
解説: 1. 与えられた情報: - 標本平均\(\bar{X} = 498\)g - 母分散\(\sigma^2 = 25\)g²(母標準偏差\(\sigma = 5\)g) - 標本サイズ\(n = 16\) - 信頼係数95%(\(z_{0.025} = 1.96\))
- 正規分布を使用する理由:
- 母集団が正規分布\(N(\mu, 25)\)に従う
- 標本平均\(\bar{X}\)も正規分布\(N(\mu, \frac{25}{16})\)に従う
-
母分散が既知(\(\sigma^2 = 25\))であるため、標準正規分布の分位点\(z_{\alpha/2}\)を使用
-
信頼区間の計算: $$ \bar{X} \pm z_{0.025}\frac{\sigma}{\sqrt{n}} = 498 \pm 1.96\frac{5}{\sqrt{16}} = 498 \pm 2.45 $$
-
したがって、信頼区間は: [498 - 2.45, 498 + 2.45] = [495.55, 500.45]
補足: - この区間は、真の母平均が含まれる確率が95%であることを示します - 区間の幅は約4.9gです - 母分散が既知であるため、t分布ではなく標準正規分布の分位点を使用しています
3. 実践的な問題
ある工場で製造される製品の重量が正規分布\(N(\mu, 16)\)に従うとする。規格値は500g±10gである。以下のデータが得られた:
- 標本サイズ:25個
- 標本平均:495g
解答:
- 母平均の95%信頼区間: [492.43g, 497.57g]
解説: 1. 与えられた情報: - 標本平均\(\bar{X} = 495\)g - 母分散\(\sigma^2 = 16\)g²(母標準偏差\(\sigma = 4\)g) - 標本サイズ\(n = 25\) - 信頼係数95%(\(z_{0.025} = 1.96\))
-
信頼区間の計算: $$ \bar{X} \pm z_{0.025}\frac{\sigma}{\sqrt{n}} = 495 \pm 1.96\frac{4}{\sqrt{25}} = 495 \pm 1.568 $$
-
したがって、信頼区間は: [495 - 1.568, 495 + 1.568] = [492.43, 497.57]
-
信頼区間の幅を半分にするには、標本サイズを4倍にする必要があります。
解説: 1. 現在の標本サイズ:25個 2. 必要な標本サイズ:100個(25 × 4)
- 規格値(500g±10g)は信頼区間[492.43g, 497.57g]に含まれていません。
解説: 1. 規格値の範囲:490g~510g 2. 信頼区間:492.43g~497.57g 3. 信頼区間は規格値の範囲内に完全に含まれています 4. これは、製品の平均重量が規格を満たしていることを示唆しています
第13回:区間推定(分散未知の場合の平均の推定)
4. 基本的な理解を確認する問題
(1) 分散未知の場合の平均の区間推定の特徴を説明せよ。
解答: 分散未知の場合の平均の区間推定には、以下の特徴があります:
- t分布の使用:
- 母分散が未知のため、標本標準偏差を使用
-
これにより、t分布を用いた区間推定が必要
-
信頼区間の式: $$ \left[\bar{X} - t_{\alpha/2}(n-1)\frac{s}{\sqrt{n}}, \bar{X} + t_{\alpha/2}(n-1)\frac{s}{\sqrt{n}}\right] $$ ここで:
- \(t_{\alpha/2}(n-1)\):自由度n-1のt分布の上側α/2点
- s:標本標準偏差
-
n:標本サイズ
-
特徴:
- 標本サイズが小さい場合、正規分布より広い区間
- 標本サイズが大きい場合(n > 30)、正規分布に近づく
- 不確実性が大きいため、より保守的な推定
(2) t分布の特徴と、正規分布との違いを説明せよ。
解答: t分布の主な特徴と正規分布との違いは以下の通りです:
- 形状の特徴:
- 正規分布より裾が厚い(重い)
- 自由度が小さいほど裾が厚い
-
自由度が大きくなるにつれて正規分布に近づく
-
数値的な特徴:
- 期待値:0(自由度 > 1)
- 分散:\(\frac{k}{k-2}\)(自由度k > 2)
-
正規分布より分散が大きい
-
正規分布との主な違い:
- 裾の厚さ:t分布の方が厚い
- 分散:t分布の方が大きい
- 収束性:自由度→∞で正規分布に収束
(3) 標本サイズが大きい場合のt分布の性質を説明せよ。
解答: 標本サイズが大きい場合(n > 30)、t分布は以下の性質を示します:
- 正規分布への収束:
- 自由度が大きくなるにつれて
- t分布は標準正規分布に近づく
-
実用上はn > 30で正規分布で近似可能
-
数値的な特徴:
- t分布の分位点は正規分布の分位点に近づく
-
例えば、95%信頼区間の場合:
- n = 30:t_{0.025}(29) ≈ 2.045
- n = ∞:z_{0.025} = 1.96
-
実践的な意味:
- 大標本では正規分布による近似が可能
- 計算が簡略化できる
- ただし、厳密にはt分布を使用する方が正確
5. 計算問題
ある製品の重量が正規分布に従うとする。9個の製品を測定したところ、平均が498g、標準偏差が5gであった。母平均\(\mu\)の95%信頼区間は \(\text{(c)} \leq \mu \leq \text{(d)}\) である。
解答: (c) = 494.33, (d) = 501.67
解説: 1. 与えられた情報: - 標本平均\(\bar{X} = 498\)g - 標本標準偏差\(s = 5\)g - 標本サイズ\(n = 9\) - 信頼係数95%(\(t_{0.025}(8) = 2.306\))
-
信頼区間の計算: $$ \bar{X} \pm t_{0.025}(8)\frac{s}{\sqrt{n}} = 498 \pm 2.306\frac{5}{\sqrt{9}} = 498 \pm 3.843 $$
-
したがって、信頼区間は: [498 - 3.843, 498 + 3.843] = [494.33, 501.67]
補足: - この区間は、真の母平均が含まれる確率が95%であることを示します - 区間の幅は約7.69gです - 分散既知の場合と比べて、区間が広くなっています
6. 実践的な問題
ある試験の得点が正規分布に従うとする。100人の学生の標本平均が65点、標本標準偏差が10点であった。
解答:
- 母平均の95%信頼区間: [63.04点, 66.96点]
解説: 1. 与えられた情報: - 標本平均\(\bar{X} = 65\)点 - 標本標準偏差\(s = 10\)点 - 標本サイズ\(n = 100\) - 信頼係数95%(\(t_{0.025}(99) ≈ 1.984\))
-
信頼区間の計算: $$ \bar{X} \pm t_{0.025}(99)\frac{s}{\sqrt{n}} = 65 \pm 1.984\frac{10}{\sqrt{100}} = 65 \pm 1.984 $$
-
したがって、信頼区間は: [65 - 1.984, 65 + 1.984] = [63.04, 66.96]
-
信頼区間の幅を半分にするには、標本サイズを4倍にする必要があります。
解説: 1. 現在の標本サイズ:100人 2. 必要な標本サイズ:400人(100 × 4)
- 全国平均が70点であるという仮説の検定:
解答: 帰無仮説\(H_0: \mu = 70\)は棄却されます。
解説: 1. 検定統計量の計算: $$ t = \frac{\bar{X} - \mu_0}{s/\sqrt{n}} = \frac{65 - 70}{10/\sqrt{100}} = -5 $$
- 棄却域の決定:
- 有意水準5%
- 両側検定
-
棄却域:\(|t| > 1.984\)
-
判定:
- \(|t| = 5 > 1.984\)
- したがって、帰無仮説を棄却
- 全国平均は70点と異なると結論
補足: - この結果は、標本の平均が全国平均より有意に低いことを示しています - 教育上の介入や対策を検討する必要があるかもしれません