3. 基本的な確率分布と期待値・分散
3.1 離散型確率分布
ベルヌーイ試行と二項分布
ベルヌーイ試行とは、以下の条件を満たす試行のことです: 1. 試行の結果が「成功」か「失敗」の2通り 2. 成功確率\(p\)は一定 3. 各試行は独立
二項分布は、\(n\)回のベルヌーイ試行で成功する回数\(X\)の分布です:
確率関数:
期待値と分散:
具体例:製品検査の問題 工場で生産される製品の不良率が2%(p=0.02)であるとき、100個の製品を検査する場合:
期待値と分散: - \(\mathbb{E}[X] = np = 100 \times 0.02 = 2\)個 - \(\mathbb{V}[X] = np(1-p) = 100 \times 0.02 \times 0.98 = 1.96\)
具体的な確率計算: - 不良品が0個である確率:\(\mathbb{P}(X = 0) = \binom{100}{0} (0.02)^0 (0.98)^{100} \approx 0.133\) - 不良品が2個である確率:\(\mathbb{P}(X = 2) = \binom{100}{2} (0.02)^2 (0.98)^{98} \approx 0.273\)
実践的応用: - 品質管理:製品ロットの不良品数予測 - マーケティング:アンケート回答率の予測
ポアソン分布
ポアソン分布は、稀な事象の発生回数を表す分布です:
確率関数:
期待値と分散:
具体例:コールセンターの電話着信 あるコールセンターで、1時間あたり平均3件の電話がかかってくる場合(λ=3):
期待値と分散: - \(\mathbb{E}[X] = \lambda = 3\)件 - \(\mathbb{V}[X] = \lambda = 3\) (ポアソン分布の特徴:期待値と分散が等しい)
具体的な確率計算: - 1時間で0件の確率:\(\mathbb{P}(X = 0) = \frac{3^0 e^{-3}}{0!} = e^{-3} \approx 0.0498\) - 1時間で3件の確率:\(\mathbb{P}(X = 3) = \frac{3^3 e^{-3}}{3!} = \frac{27 e^{-3}}{6} \approx 0.224\) - 1時間で5件以上の確率:\(\mathbb{P}(X \geq 5) = 1 - \mathbb{P}(X \leq 4) \approx 0.185\)
実践的応用: - 待ち行列理論:サービス設計 - 疫学:稀な疾患の発生率 - 交通工学:事故発生頻度の分析
3.2 連続型確率分布
正規分布
正規分布は、最も重要な連続型確率分布です:
確率密度関数:
標準正規分布の期待値と分散の計算
標準正規分布の確率密度関数は以下のように定義されます:
1. 期待値 \(\mathbb{E}[X] = 0\) の計算
期待値は以下の積分で計算されます:
被積分関数 \(g(x) = x \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}\) について:
つまり、\(g(x)\) は奇関数です。奇関数の対称区間での積分は0になるため:
2. 分散 \(\mathbb{V}(X) = 1\) の計算
分散は \(\mathbb{V}(X) = \mathbb{E}[X^2] - (\mathbb{E}[X])^2\) で計算されます。\(\mathbb{E}[X] = 0\) なので:
被積分関数 \(x^2 e^{-x^2/2}\) は偶関数なので、
と区間を半分にして2倍することができます。これを部分積分により計算します。
部分積分を用いて計算します:
\(u = x\), \(dv = x e^{-\frac{x^2}{2}} dx\) とおくと: - \(du = dx\) - \(v = -e^{-\frac{x^2}{2}}\)
部分積分の公式 \(\int u dv = uv - \int v du\) より:
第1項は \(\lim_{x \to \pm\infty} x e^{-\frac{x^2}{2}} = 0\) より消滅し、 第2項は確率密度関数の性質より \(\int_{-\infty}^{\infty} e^{-\frac{x^2}{2}} dx = \sqrt{2\pi}\) となるため:
よって:
したがって:
一般の正規分布への拡張
一般の正規分布は、標準正規分布からの線形変換として得られます:
期待値と分散の線形性より: - \(\mathbb{E}[X] = \sigma \mathbb{E}[Z] + \mu = \mu\) - \(\mathbb{V}(X) = \sigma^2 \mathbb{V}(Z) = \sigma^2\)
具体例:身長データの分析 成人男性の身長が平均170cm、標準偏差5cmの正規分布に従うとする:
68-95-99.7ルールの適用: - 165cm〜175cm(平均±1標準偏差)の範囲:約68% - 160cm〜180cm(平均±2標準偏差)の範囲:約95% - 155cm〜185cm(平均±3標準偏差)の範囲:約99.7%
具体的な確率計算: - 身長が175cm以上の確率:\(\mathbb{P}(X \geq 175) = \mathbb{P}\left(Z \geq \frac{175-170}{5}\right) = \mathbb{P}(Z \geq 1) \approx 0.159\) - 身長が165cm〜175cmの確率:\(\mathbb{P}(165 \leq X \leq 175) = \mathbb{P}(-1 \leq Z \leq 1) \approx 0.683\)
重要な確率(標準正規分布): - \(\mathbb{P}(|Z| \leq 1) \approx 0.6827\) (68%ルール) - \(\mathbb{P}(|Z| \leq 2) \approx 0.9545\) (95%ルール) - \(\mathbb{P}(|Z| \leq 3) \approx 0.9973\) (99.7%ルール)
指数分布
指数分布は、待ち時間や寿命を表す分布です:
確率密度関数:
期待値と分散:
無記憶性:
一様分布
一様分布は、区間\([a,b]\)上で等確率の分布です:
確率密度関数:
期待値と分散:
3.3 期待値と分散の性質
期待値の性質
- 線形性:
- 独立な確率変数の和:
- 一般の場合:
分散の性質
- 定義:
- 線形変換:
- 独立な確率変数の和:
共分散と相関係数
共分散:
相関係数:
性質: 1. \(-1 \leq \rho_{X,Y} \leq 1\) 2. \(X\)と\(Y\)が独立なら\(\text{Cov}(X,Y) = 0\) 3. \(\mathbb{V}[X + Y] = \mathbb{V}[X] + \mathbb{V}[Y] + 2\text{Cov}(X,Y)\)
2変量正規分布の例
2つの確率変数\((X,Y)\)が2変量正規分布に従う場合、その同時確率密度関数は以下のように表されます:
ここで: - \(\mu_1, \mu_2\):それぞれ\(X,Y\)の期待値 - \(\sigma_1^2, \sigma_2^2\):それぞれ\(X,Y\)の分散 - \(\rho\):\(X,Y\)の相関係数
特に、標準正規分布(\(\mu_1=\mu_2=0, \sigma_1=\sigma_2=1\))の場合:
重要な性質: 1. \(\rho = 0\) のとき、\(X\)と\(Y\)は独立 2. \(\rho = \pm 1\) のとき、\(X\)と\(Y\)は完全相関(直線上に分布) 3. 任意の線形結合 \(aX + bY\) も正規分布に従う
3.4 分布の近似
二項分布の正規近似
\(n\)が大きく、\(p\)が0や1に近くないとき:
連続性補正:
ポアソン過程
単位時間あたり平均\(\lambda\)回のイベントが発生する過程: 1. イベント間の時間\(T\)は\(\text{Exp}(\lambda)\)に従う 2. 時間\(t\)内のイベント数\(N(t)\)は\(\text{Po}(\lambda t)\)に従う
実践的計算例
期待値・分散の計算練習
例1:離散型確率変数の期待値・分散 サイコロを振って、出た目の2倍の報酬がもらえるゲーム:
\(X\):サイコロの目, \(Y = 2X\):報酬
期待値の計算: \(\(\mathbb{E}[Y] = \mathbb{E}[2X] = 2\mathbb{E}[X] = 2 \times \frac{1+2+3+4+5+6}{6} = 2 \times 3.5 = 7\)\)
分散の計算: \(\(\mathbb{V}[Y] = \mathbb{V}[2X] = 4\mathbb{V}[X] = 4 \times \frac{35}{12} = \frac{35}{3} \approx 11.67\)\)
例2:連続型確率変数の期待値計算 一様分布 \(U(0,10)\) に従う製造時間:
期待値:\(\mathbb{E}[X] = \frac{0+10}{2} = 5\)分 分散:\(\mathbb{V}[X] = \frac{(10-0)^2}{12} = \frac{100}{12} = \frac{25}{3} \approx 8.33\)
例3:共分散と相関の計算 2つの株式の収益率 \(X, Y\) の関係:
データ:\((x_1, y_1) = (0.05, 0.03)\), \((x_2, y_2) = (0.10, 0.08)\), \((x_3, y_3) = (-0.02, 0.01)\)
平均:\(\bar{x} = 0.043\), \(\bar{y} = 0.040\)
共分散: \(\(\text{Cov}(X,Y) = \frac{1}{3}\sum_{i=1}^3 (x_i - \bar{x})(y_i - \bar{y}) = 0.00193\)\)
相関係数: \(\(\rho = \frac{\text{Cov}(X,Y)}{\sqrt{\mathbb{V}[X]\mathbb{V}[Y]}} = \frac{0.00193}{\sqrt{0.00253 \times 0.00113}} = 0.36\)\)