コンテンツにスキップ

3. 基本的な確率分布と期待値・分散

3.1 離散型確率分布

ベルヌーイ試行と二項分布

ベルヌーイ試行とは、以下の条件を満たす試行のことです: 1. 試行の結果が「成功」か「失敗」の2通り 2. 成功確率\(p\)は一定 3. 各試行は独立

二項分布は、\(n\)回のベルヌーイ試行で成功する回数\(X\)の分布です:

\[ X \sim \text{Bin}(n,p) \]

確率関数:

\[ \mathbb{P}(X = k) = \binom{n}{k} p^k (1-p)^{n-k}, \quad k = 0,1,\ldots,n \]

期待値と分散:

\[ \mathbb{E}[X] = np, \quad \mathbb{V}[X] = np(1-p) \]

具体例:製品検査の問題 工場で生産される製品の不良率が2%(p=0.02)であるとき、100個の製品を検査する場合:

期待値と分散: - \(\mathbb{E}[X] = np = 100 \times 0.02 = 2\)個 - \(\mathbb{V}[X] = np(1-p) = 100 \times 0.02 \times 0.98 = 1.96\)

具体的な確率計算: - 不良品が0個である確率:\(\mathbb{P}(X = 0) = \binom{100}{0} (0.02)^0 (0.98)^{100} \approx 0.133\) - 不良品が2個である確率:\(\mathbb{P}(X = 2) = \binom{100}{2} (0.02)^2 (0.98)^{98} \approx 0.273\)

実践的応用: - 品質管理:製品ロットの不良品数予測 - マーケティング:アンケート回答率の予測

ポアソン分布

ポアソン分布は、稀な事象の発生回数を表す分布です:

\[ X \sim \text{Po}(\lambda) \]

確率関数:

\[ \mathbb{P}(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0,1,2,\ldots \]

期待値と分散:

\[ \mathbb{E}[X] = \lambda, \quad \mathbb{V}[X] = \lambda \]

具体例:コールセンターの電話着信 あるコールセンターで、1時間あたり平均3件の電話がかかってくる場合(λ=3):

期待値と分散: - \(\mathbb{E}[X] = \lambda = 3\)件 - \(\mathbb{V}[X] = \lambda = 3\) (ポアソン分布の特徴:期待値と分散が等しい)

具体的な確率計算: - 1時間で0件の確率:\(\mathbb{P}(X = 0) = \frac{3^0 e^{-3}}{0!} = e^{-3} \approx 0.0498\) - 1時間で3件の確率:\(\mathbb{P}(X = 3) = \frac{3^3 e^{-3}}{3!} = \frac{27 e^{-3}}{6} \approx 0.224\) - 1時間で5件以上の確率:\(\mathbb{P}(X \geq 5) = 1 - \mathbb{P}(X \leq 4) \approx 0.185\)

実践的応用: - 待ち行列理論:サービス設計 - 疫学:稀な疾患の発生率 - 交通工学:事故発生頻度の分析

3.2 連続型確率分布

正規分布

正規分布は、最も重要な連続型確率分布です:

\[ X \sim N(\mu, \sigma^2) \]

確率密度関数:

\[ f(x) = \frac{1}{\sqrt{2\pi}\sigma} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) \]

標準正規分布の期待値と分散の計算

標準正規分布の確率密度関数は以下のように定義されます:

\[ f(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}, \quad x \in \mathbb{R} \]
1. 期待値 \(\mathbb{E}[X] = 0\) の計算

期待値は以下の積分で計算されます:

\[ \mathbb{E}[X] = \int_{-\infty}^{\infty} x \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} dx \]

被積分関数 \(g(x) = x \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}\) について:

\[ g(-x) = (-x) \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{(-x)^2}{2}} = -x \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} = -g(x) \]

つまり、\(g(x)\) は奇関数です。奇関数の対称区間での積分は0になるため:

\[ \mathbb{E}[X] = \int_{-\infty}^{\infty} x \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} dx = 0 \]
2. 分散 \(\mathbb{V}(X) = 1\) の計算

分散は \(\mathbb{V}(X) = \mathbb{E}[X^2] - (\mathbb{E}[X])^2\) で計算されます。\(\mathbb{E}[X] = 0\) なので:

\[ \mathbb{V}(X) = \mathbb{E}[X^2] = \int_{-\infty}^{\infty} x^2 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} dx \]

被積分関数 \(x^2 e^{-x^2/2}\) は偶関数なので、

\[ \int_{-\infty}^{\infty} x^2 e^{-\frac{x^2}{2}} dx = 2 \int_{0}^{\infty} x^2 e^{-\frac{x^2}{2}} dx \]

と区間を半分にして2倍することができます。これを部分積分により計算します。

部分積分を用いて計算します:

\(u = x\), \(dv = x e^{-\frac{x^2}{2}} dx\) とおくと: - \(du = dx\) - \(v = -e^{-\frac{x^2}{2}}\)

部分積分の公式 \(\int u dv = uv - \int v du\) より:

\[ \int_{-\infty}^{\infty} x^2 e^{-\frac{x^2}{2}} dx = \left[x \cdot (-e^{-\frac{x^2}{2}})\right]_{-\infty}^{\infty} - \int_{-\infty}^{\infty} (-e^{-\frac{x^2}{2}}) dx \]

第1項は \(\lim_{x \to \pm\infty} x e^{-\frac{x^2}{2}} = 0\) より消滅し、 第2項は確率密度関数の性質より \(\int_{-\infty}^{\infty} e^{-\frac{x^2}{2}} dx = \sqrt{2\pi}\) となるため:

\[ \int_{-\infty}^{\infty} x^2 e^{-\frac{x^2}{2}} dx = \sqrt{2\pi} \]

よって:

\[ \mathbb{E}[X^2] = \frac{1}{\sqrt{2\pi}} \cdot \sqrt{2\pi} = 1 \]

したがって:

\[ \mathbb{V}(X) = \mathbb{E}[X^2] - (\mathbb{E}[X])^2 = 1 - 0^2 = 1 \]

一般の正規分布への拡張

一般の正規分布は、標準正規分布からの線形変換として得られます:

\[ X = \sigma Z + \mu \quad (\text{ただし} Z \sim N(0,1)) \]

期待値と分散の線形性より: - \(\mathbb{E}[X] = \sigma \mathbb{E}[Z] + \mu = \mu\) - \(\mathbb{V}(X) = \sigma^2 \mathbb{V}(Z) = \sigma^2\)

具体例:身長データの分析 成人男性の身長が平均170cm、標準偏差5cmの正規分布に従うとする:

68-95-99.7ルールの適用: - 165cm〜175cm(平均±1標準偏差)の範囲:約68% - 160cm〜180cm(平均±2標準偏差)の範囲:約95% - 155cm〜185cm(平均±3標準偏差)の範囲:約99.7%

具体的な確率計算: - 身長が175cm以上の確率:\(\mathbb{P}(X \geq 175) = \mathbb{P}\left(Z \geq \frac{175-170}{5}\right) = \mathbb{P}(Z \geq 1) \approx 0.159\) - 身長が165cm〜175cmの確率:\(\mathbb{P}(165 \leq X \leq 175) = \mathbb{P}(-1 \leq Z \leq 1) \approx 0.683\)

重要な確率(標準正規分布): - \(\mathbb{P}(|Z| \leq 1) \approx 0.6827\) (68%ルール) - \(\mathbb{P}(|Z| \leq 2) \approx 0.9545\) (95%ルール) - \(\mathbb{P}(|Z| \leq 3) \approx 0.9973\) (99.7%ルール)

指数分布

指数分布は、待ち時間や寿命を表す分布です:

\[ X \sim \text{Exp}(\lambda) \]

確率密度関数:

\[ f(x) = \lambda e^{-\lambda x}, \quad x \geq 0 \]

期待値と分散:

\[ \mathbb{E}[X] = \frac{1}{\lambda}, \quad \mathbb{V}[X] = \frac{1}{\lambda^2} \]

無記憶性

\[ \mathbb{P}(X > s + t | X > s) = \mathbb{P}(X > t) \]

一様分布

一様分布は、区間\([a,b]\)上で等確率の分布です:

\[ X \sim U(a,b) \]

確率密度関数:

\[ f(x) = \frac{1}{b-a}, \quad a \leq x \leq b \]

期待値と分散:

\[ \mathbb{E}[X] = \frac{a+b}{2}, \quad \mathbb{V}[X] = \frac{(b-a)^2}{12} \]

3.3 期待値と分散の性質

期待値の性質

  1. 線形性:
\[ \mathbb{E}[aX + b] = a\mathbb{E}[X] + b \]
  1. 独立な確率変数の和:
\[ \mathbb{E}[X + Y] = \mathbb{E}[X] + \mathbb{E}[Y] \]
  1. 一般の場合:
\[ \mathbb{E}[g(X)] = \begin{cases} \displaystyle\sum_i g(x_i) \mathbb{P}(X = x_i) & \text{離散型} \\ \displaystyle\int_{-\infty}^{\infty} g(x) f(x) dx & \text{連続型} \end{cases} \]

分散の性質

  1. 定義:
\[ \mathbb{V}[X] = \mathbb{E}[(X - \mathbb{E}[X])^2] = \mathbb{E}[X^2] - (\mathbb{E}[X])^2 \]
  1. 線形変換:
\[ \mathbb{V}[aX + b] = a^2 \mathbb{V}[X] \]
  1. 独立な確率変数の和:
\[ \mathbb{V}[X + Y] = \mathbb{V}[X] + \mathbb{V}[Y] \]

共分散と相関係数

共分散

\[ \text{Cov}(X,Y) = \mathbb{E}[(X - \mathbb{E}[X])(Y - \mathbb{E}[Y])] = \mathbb{E}[XY] - \mathbb{E}[X]\mathbb{E}[Y] \]

相関係数

\[ \rho_{X,Y} = \frac{\text{Cov}(X,Y)}{\sqrt{\mathbb{V}[X]\mathbb{V}[Y]}} \]

性質: 1. \(-1 \leq \rho_{X,Y} \leq 1\) 2. \(X\)\(Y\)が独立なら\(\text{Cov}(X,Y) = 0\) 3. \(\mathbb{V}[X + Y] = \mathbb{V}[X] + \mathbb{V}[Y] + 2\text{Cov}(X,Y)\)

2変量正規分布の例

2つの確率変数\((X,Y)\)が2変量正規分布に従う場合、その同時確率密度関数は以下のように表されます:

\[ f(x,y) = \frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}} \exp\left(-\frac{1}{2(1-\rho^2)}\left[\frac{(x-\mu_1)^2}{\sigma_1^2} + \frac{(y-\mu_2)^2}{\sigma_2^2} - 2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}\right]\right) \]

ここで: - \(\mu_1, \mu_2\):それぞれ\(X,Y\)の期待値 - \(\sigma_1^2, \sigma_2^2\):それぞれ\(X,Y\)の分散 - \(\rho\)\(X,Y\)の相関係数

特に、標準正規分布(\(\mu_1=\mu_2=0, \sigma_1=\sigma_2=1\))の場合:

\[ f(x,y) = \frac{1}{2\pi\sqrt{1-\rho^2}} \exp\left(-\frac{1}{2(1-\rho^2)}(x^2 + y^2 - 2\rho xy)\right) \]

重要な性質: 1. \(\rho = 0\) のとき、\(X\)\(Y\)は独立 2. \(\rho = \pm 1\) のとき、\(X\)\(Y\)は完全相関(直線上に分布) 3. 任意の線形結合 \(aX + bY\) も正規分布に従う

3.4 分布の近似

二項分布の正規近似

\(n\)が大きく、\(p\)が0や1に近くないとき:

\[ \text{Bin}(n,p) \approx N(np, np(1-p)) \]

連続性補正

\[ \mathbb{P}(a \leq X \leq b) \approx \mathbb{P}\left(a - \frac{1}{2} \leq Z \leq b + \frac{1}{2}\right) \]

ポアソン過程

単位時間あたり平均\(\lambda\)回のイベントが発生する過程: 1. イベント間の時間\(T\)\(\text{Exp}(\lambda)\)に従う 2. 時間\(t\)内のイベント数\(N(t)\)\(\text{Po}(\lambda t)\)に従う

実践的計算例

期待値・分散の計算練習

例1:離散型確率変数の期待値・分散 サイコロを振って、出た目の2倍の報酬がもらえるゲーム:

\(X\):サイコロの目, \(Y = 2X\):報酬

期待値の計算: \(\(\mathbb{E}[Y] = \mathbb{E}[2X] = 2\mathbb{E}[X] = 2 \times \frac{1+2+3+4+5+6}{6} = 2 \times 3.5 = 7\)\)

分散の計算: \(\(\mathbb{V}[Y] = \mathbb{V}[2X] = 4\mathbb{V}[X] = 4 \times \frac{35}{12} = \frac{35}{3} \approx 11.67\)\)

例2:連続型確率変数の期待値計算 一様分布 \(U(0,10)\) に従う製造時間:

期待値:\(\mathbb{E}[X] = \frac{0+10}{2} = 5\)分 分散:\(\mathbb{V}[X] = \frac{(10-0)^2}{12} = \frac{100}{12} = \frac{25}{3} \approx 8.33\)

例3:共分散と相関の計算 2つの株式の収益率 \(X, Y\) の関係:

データ:\((x_1, y_1) = (0.05, 0.03)\), \((x_2, y_2) = (0.10, 0.08)\), \((x_3, y_3) = (-0.02, 0.01)\)

平均:\(\bar{x} = 0.043\), \(\bar{y} = 0.040\)

共分散: \(\(\text{Cov}(X,Y) = \frac{1}{3}\sum_{i=1}^3 (x_i - \bar{x})(y_i - \bar{y}) = 0.00193\)\)

相関係数: \(\(\rho = \frac{\text{Cov}(X,Y)}{\sqrt{\mathbb{V}[X]\mathbb{V}[Y]}} = \frac{0.00193}{\sqrt{0.00253 \times 0.00113}} = 0.36\)\)

演習問題

第3章の演習問題はこちら