2024年度 確率・統計学試験問題
問題 1
(a) 事象 \(A, B\) について \(\mathbb{P}(A)+\mathbb{P}(B)-\mathbb{P}(A \cup B)=\mathbb{P}(\ (a)\ )\) である。
(b) 線形回帰において、外れ値の影響で \(R^2\) の取りうる全ての値について最小値 \((b)\) から最大値 \(1\) となる。
(c) 2次元のデータが共に標本平均 \(0\)、標本偏差 \(1\) であるとき、相関係数 \(r\) と回帰直線の傾き \(a\)、切片 \(b\) との間に \((c)\) が成立する。
(d) \(\mathbb{P}(X=2)=\frac{1}{3}, \quad \mathbb{P}(X=1) = \frac{2}{3}\) であるとき、期待値は \(\mathbb{E}(X)=\) \((d)\) となる。ただし分数で答えよ。
(e) \(c\) は定数として、\(f (x) = c \cdot x(x-1) \cdot 1_{[-1,0]}(x) \quad (x \in \mathbb{R})\) とする。ある確率変数が \(f\) を確率密度関数にもつ。このとき \(c\) が定まり \(c=\) \((e)_1\) となる。さらに \(\mathbb{P}(-1/2 \leq X<2)=\) \((e)_2\) を分数で答えよ。
問題 2
ある疾病の有病率 \(p\) とし、疾病にかかっている人が陽性反応を示す確率(感度)と、疾病にかかっていない人が陰性反応を示す確率(特異度)がともに \(q\) である検査。有病者かどうかを確率変数を \(X \in \{0,1\}\)(\(X=1\) なら有病、\(X=0\) なら非有病)、陽性反応または陰性反応に対応する確率変数を \(Y \in \{0,1 \}\)(\(Y=1\) なら陽性、\(Y=0\) なら陰性)とする。
(a) \(p=1/5, \quad q=1/10\) であるとき、\(\mathbb{P}(Y=1 |X=1 )=\) \((a)\) である。分数で答えよ。
(b) \(p=q=1/3\) であるとき、\(\mathbb{P}(Y=0 |X=1 )=\) \((b)\) である。分数で答えよ。
(c) \(p=q=1/4\) であるとき、\(\mathbb{P}(Y=1 |X=0 )=\) \((c)\) である。分数で答えよ。
(d) \(q=p/10\) であるとき、陽性反応がでる確率を \(p\) は \(\mathbb{P}(Y=1)=1-\) \((d)_1\) \(p +\) \((d)_2\) \(p^2\) となる。ただし分数で求めよ。
(e) \(p=q\) であるとする。陽性反応がでた条件のもとで実際に疾病にかかっている確率が8割を達成する \(p\) を分数で答えよ。\((e)\)
問題 3
(a) \(Z_1, Z_2, \dots, Z_n\) は標準正規分布を持つ確率変数であるとする。つまり、\(Z_1, Z_2, \dots, Z_n \sim \mathcal{N}(0,1)\) である。このとき、次の分散は \(\mathbb{V}(Z_{n})=\) \((a)_1\) であり、また \(\mathbb{E}(-Z_{n})+ \mathbb{V}(Z_{n})=\) \((a)_2\) となる。さらに独立であるなら、\(\mathbb{V}(Z_{n-1} + Z_n)=\) \((a)_3\) となる。
(b) \(\{S_n\}\) は \((n,p)\) の二項分布をもつ確率変数列であるとする。つまり、\(S_n \sim \text{Bi}(n,p)\) とする。このときに \(\mathbb{E}(S_{n})=\) \((b)_1\) である。さらに \(\mathbb{V}(S_{n})=\) \((b)_2\) となる。
したがって、\(Z_n = \frac{S_n}{\sqrt{n}} - \mathbb{E}\left(\frac{S_n}{\sqrt{n}}\right)\) は \(n\) が大きい時は正規分布で近似でき、その期待値 \(\mathbb{E}(Z_n)=\) \((b)_3\) であり、分散は \(\mathbb{V}(Z_n)=\) \((b)_4\) となる。
特に \(n\) が大きい時でも \(np \approx 1\) であるならば、\(S_n\) は強度 \(\lambda=1\) をもつポアソン分布で近似できて \(\mathbb{P}(1 \leq S_n <3) \approx\) \((b)_5\) \(e^{-\lambda}\) となる。答えは分数で答えよ。
問題 4
(a) 試験の得点が平均50点、標準偏差5点の正規分布に従う場合、上位5%に入るためには最低でも \((a)\) 点取らないといけない。自然数で答えよ。
(b) \(\alpha\) を \(\alpha = 2 \times 0.022750\) とする。\(\mathbb{P}(Z > z_{\alpha/2})=\alpha/2\) となるとき、\(z_{\alpha/2}=\) \((b)_1\) である。小数点第一位まで(二位以下は切り捨てて)求めよ。さらに \((1-\alpha)\) 信頼区間でサンプル比率 \(1/2\) である信頼区間の幅を \(\pm 0.02\) に収めたい。このとき、サンプルサイズは少なくとも \((b)_2\) 必要である。整数で答えよ。
(c) 二人の候補者のうち代表を決める選挙を行っていて、ランダムに \(n\) 回の出口調査を実施しました。二人の代表者の得票率の均衡が崩れたときに、以下の意味で当確予想をだすとします。それは片側検定で \(\alpha\) で投票率が拮抗しているという帰無仮説が否定された時とします。
具体的な設定として、\(\alpha = 0.0013499\) で \(n=100\) とします。このとき、少なくとも勝利する候補者は100人の出口調査のうち、\((c)\) 票をとれば当確予想を発表することになるか。整数で答えよ。
確率・統計学試験問題 解答と解説
問題 1
(a)
考え方と計算過程: 確率の加法定理は、事象 \(A\) と事象 \(B\) の和事象 \(A \cup B\) の確率について、以下のように表されます。 \(\mathbb{P}(A \cup B) = \mathbb{P}(A) + \mathbb{P}(B) - \mathbb{P}(A \cap B)\) この式を移項して \(\mathbb{P}(A \cap B)\) について解くと、 \(\mathbb{P}(A \cap B) = \mathbb{P}(A) + \mathbb{P}(B) - \mathbb{P}(A \cup B)\) となります。 解答: \((a) = A \cap B\)
(b)
考え方と計算過程: 決定係数 \(R^2\) は、回帰モデルがデータにどれだけよく当てはまっているかを示す指標です。その値は常に \(0 \le R^2 \le 1\) の範囲にあります。\(R^2=1\) はモデルがデータを完全に説明している場合、\(R^2=0\) はモデルがデータを全く説明していない場合(目的変数の分散のうち説明変数で説明できる割合が0の場合)を意味します。外れ値は \(R^2\) の値を変動させる可能性がありますが、\(R^2\) の取りうる値の範囲(最小値0から最大値1)自体は変わりません。 解答: \((b) = 0\)
(c)
考え方と計算過程: 2次元のデータ \((x_i, y_i)\) について、標本平均が共に \(0\) (\(\bar{x}=0, \bar{y}=0\))、標本標準偏差が共に \(1\) (\(s_x=1, s_y=1\)) であるとします。 単回帰直線の傾き \(a\) と切片 \(b\) は、一般に以下のように与えられます。 \(a = r \frac{s_y}{s_x}\) \(b = \bar{y} - a\bar{x}\) ここで、\(r\) は \(x\) と \(y\) の相関係数です。 与えられた条件 \(s_x=1, s_y=1, \bar{x}=0, \bar{y}=0\) を代入すると、 \(a = r \frac{1}{1} = r\) \(b = 0 - a \cdot 0 = 0\) となります。 解答: \((c) = (a=r, b=0)\)
(d)
考え方と計算過程: 離散確率変数 \(X\) の期待値 \(\mathbb{E}(X)\) は、各々の値 \(x_i\) とその確率 \(\mathbb{P}(X=x_i)\) の積の総和で定義されます。 \(\mathbb{E}(X) = \sum_i x_i \mathbb{P}(X=x_i)\) この問題では、\(X\) が取りうる値は \(1\) と \(2\) であり、それぞれの確率は \(\mathbb{P}(X=1) = \frac{2}{3}\) と \(\mathbb{P}(X=2) = \frac{1}{3}\) です。 したがって、期待値は \(\mathbb{E}(X) = 1 \cdot \mathbb{P}(X=1) + 2 \cdot \mathbb{P}(X=2)\) \(= 1 \cdot \frac{2}{3} + 2 \cdot \frac{1}{3}\) \(= \frac{2}{3} + \frac{2}{3} = \frac{4}{3}\) 解答: \((d) = \frac{4}{3}\)
(e)
考え方と計算過程: \(f(x)\) が確率密度関数であるためには、以下の2つの条件を満たす必要があります。 1. 全ての \(x\) に対して \(f(x) \ge 0\) (これは \(c \cdot x(x-1)\) が区間 \([-1,0]\) で非負であることから \(c \ge 0\) を意味します。\(x \in [-1,0]\) のとき \(x \le 0\) かつ \(x-1 < 0\) なので \(x(x-1) \ge 0\) です。) 2. \(\int_{-\infty}^{\infty} f(x)dx = 1\)
指示関数 \(1_{[-1,0]}(x)\) は、\(x \in [-1,0]\) のとき \(1\)、それ以外のとき \(0\) を取る関数です。したがって、\(f(x)\) は \(x \in [-1,0]\) の範囲外では \(0\) となります。 積分条件から \(c\) を求めます。 \(\int_{-\infty}^{\infty} f(x)dx = \int_{-1}^{0} c \cdot x(x-1) dx = c \int_{-1}^{0} (x^2 - x) dx = 1\) \(c \left[ \frac{x^3}{3} - \frac{x^2}{2} \right]_{-1}^{0} = 1\) \(c \left( \left( \frac{0^3}{3} - \frac{0^2}{2} \right) - \left( \frac{(-1)^3}{3} - \frac{(-1)^2}{2} \right) \right) = 1\) \(c \left( 0 - \left( -\frac{1}{3} - \frac{1}{2} \right) \right) = 1\) \(c \left( - \left( -\frac{2}{6} - \frac{3}{6} \right) \right) = 1\) \(c \left( - \left( -\frac{5}{6} \right) \right) = c \cdot \frac{5}{6} = 1\) よって、\(c = \frac{6}{5}\)。これは \(c \ge 0\) を満たします。
次に、\(\mathbb{P}(-1/2 \leq X < 2)\) を計算します。確率変数 \(X\) の値は区間 \([-1,0]\) に限定されるため、実質的な積分範囲は \(X\) が定義される範囲と指定された範囲の共通部分となります。 \(\mathbb{P}(-1/2 \leq X < 2) = \int_{-1/2}^{\min(0,2)} f(x)dx = \int_{-1/2}^{0} \frac{6}{5} x(x-1) dx\) \(= \frac{6}{5} \int_{-1/2}^{0} (x^2 - x) dx\) \(= \frac{6}{5} \left[ \frac{x^3}{3} - \frac{x^2}{2} \right]_{-1/2}^{0}\) \(= \frac{6}{5} \left( \left( \frac{0^3}{3} - \frac{0^2}{2} \right) - \left( \frac{(-1/2)^3}{3} - \frac{(-1/2)^2}{2} \right) \right)\) \(= \frac{6}{5} \left( 0 - \left( \frac{-1/8}{3} - \frac{1/4}{2} \right) \right)\) \(= \frac{6}{5} \left( - \left( -\frac{1}{24} - \frac{1}{8} \right) \right)\) \(= \frac{6}{5} \left( - \left( -\frac{1}{24} - \frac{3}{24} \right) \right)\) \(= \frac{6}{5} \left( - \left( -\frac{4}{24} \right) \right) = \frac{6}{5} \cdot \frac{4}{24} = \frac{6}{5} \cdot \frac{1}{6} = \frac{1}{5}\) 解答: \((e)_1 = \frac{6}{5}\), \((e)_2 = \frac{1}{5}\)
問題 2
与えられた情報: - 有病率: \(\mathbb{P}(X=1) = p\) - 非有病率: \(\mathbb{P}(X=0) = 1-p\) - 感度 (疾病にかかっている人が陽性反応を示す確率): \(\mathbb{P}(Y=1|X=1) = q\) - 特異度 (疾病にかかっていない人が陰性反応を示す確率): \(\mathbb{P}(Y=0|X=0) = q\)
ここから派生する確率: - 偽陰性率 (疾病にかかっている人が陰性反応を示す確率): \(\mathbb{P}(Y=0|X=1) = 1 - \mathbb{P}(Y=1|X=1) = 1-q\) - 偽陽性率 (疾病にかかっていない人が陽性反応を示す確率): \(\mathbb{P}(Y=1|X=0) = 1 - \mathbb{P}(Y=0|X=0) = 1-q\)
(a)
考え方と計算過程: 求める確率は \(\mathbb{P}(Y=1|X=1)\) です。これは感度の定義そのものです。 問題文より、感度は \(q\) です。与えられた値 \(p=1/5, q=1/10\) のうち、\(q\) を使います。 \(\mathbb{P}(Y=1|X=1) = q = \frac{1}{10}\) 解答: \((a) = \frac{1}{10}\)
(b)
考え方と計算過程: 求める確率は \(\mathbb{P}(Y=0|X=1)\) です。これは疾病にかかっている条件下で陰性反応となる確率、すなわち偽陰性率です。 \(\mathbb{P}(Y=0|X=1) = 1 - \mathbb{P}(Y=1|X=1) = 1-q\) 与えられた値は \(p=q=1/3\) なので、\(q=1/3\) を用います。 \(\mathbb{P}(Y=0|X=1) = 1 - \frac{1}{3} = \frac{2}{3}\) 解答: \((b) = \frac{2}{3}\)
(c)
考え方と計算過程: 求める確率は \(\mathbb{P}(Y=1|X=0)\) です。これは疾病にかかっていない条件下で陽性反応となる確率、すなわち偽陽性率です。 \(\mathbb{P}(Y=1|X=0) = 1 - \mathbb{P}(Y=0|X=0) = 1-q\) 与えられた値は \(p=q=1/4\) なので、\(q=1/4\) を用います。 \(\mathbb{P}(Y=1|X=0) = 1 - \frac{1}{4} = \frac{3}{4}\) 解答: \((c) = \frac{3}{4}\)
(d)
考え方と計算過程: 陽性反応が出る確率 \(\mathbb{P}(Y=1)\) は、全確率の定理を用いて以下のように計算できます。 \(\mathbb{P}(Y=1) = \mathbb{P}(Y=1|X=1)\mathbb{P}(X=1) + \mathbb{P}(Y=1|X=0)\mathbb{P}(X=0)\) ここで、\(\mathbb{P}(X=1)=p\), \(\mathbb{P}(Y=1|X=1)=q\), \(\mathbb{P}(X=0)=1-p\), \(\mathbb{P}(Y=1|X=0)=1-q\) です。 \(\mathbb{P}(Y=1) = q \cdot p + (1-q)(1-p)\) 問題の条件 \(q=p/10\) を代入します。 \(\mathbb{P}(Y=1) = \left(\frac{p}{10}\right) p + \left(1-\frac{p}{10}\right)(1-p)\) \(= \frac{p^2}{10} + \left(1 - p - \frac{p}{10} + \frac{p^2}{10}\right)\) \(= \frac{p^2}{10} + 1 - \frac{10p}{10} - \frac{p}{10} + \frac{p^2}{10}\) \(= \frac{2p^2}{10} - \frac{11p}{10} + 1\) \(= \frac{1}{5}p^2 - \frac{11}{10}p + 1\) 問題の形式 \(1 - (d)_1 p + (d)_2 p^2\) と比較すると、 \((d)_1 = \frac{11}{10}\), \((d)_2 = \frac{1}{5}\) 解答: \((d)_1 = \frac{11}{10}\), \((d)_2 = \frac{1}{5}\)
(e)
考え方と計算過程: 陽性反応が出た条件のもとで実際に疾病にかかっている確率は \(\mathbb{P}(X=1|Y=1)\) です。これはベイズの定理を用いて計算します。 \(\mathbb{P}(X=1|Y=1) = \frac{\mathbb{P}(Y=1|X=1)\mathbb{P}(X=1)}{\mathbb{P}(Y=1)}\) 分母の \(\mathbb{P}(Y=1)\) は、(d)と同様に計算できます。 \(\mathbb{P}(Y=1) = \mathbb{P}(Y=1|X=1)\mathbb{P}(X=1) + \mathbb{P}(Y=1|X=0)\mathbb{P}(X=0)\) 条件として \(p=q\) が与えられています。 \(\mathbb{P}(Y=1|X=1) = q = p\) \(\mathbb{P}(X=1) = p\) \(\mathbb{P}(Y=1|X=0) = 1-q = 1-p\) \(\mathbb{P}(X=0) = 1-p\) これらを代入すると、 \(\mathbb{P}(X=1|Y=1) = \frac{p \cdot p}{p \cdot p + (1-p)(1-p)}\) \(= \frac{p^2}{p^2 + (1-p)^2} = \frac{p^2}{p^2 + 1 - 2p + p^2} = \frac{p^2}{2p^2 - 2p + 1}\) この確率が8割 (0.8) になるときの \(p\) を求めます。 \(\frac{p^2}{2p^2 - 2p + 1} = 0.8 = \frac{8}{10} = \frac{4}{5}\) \(5 p^2 = 4 (2p^2 - 2p + 1)\) \(5 p^2 = 8p^2 - 8p + 4\) \(3p^2 - 8p + 4 = 0\) この2次方程式を解きます。因数分解すると、 \((3p-2)(p-2) = 0\) よって、\(p = \frac{2}{3}\) または \(p=2\) です。 確率は \(0 \le p \le 1\) の範囲にあるため、\(p=2\) は不適です。したがって \(p = \frac{2}{3}\)。 解答: \((e) = \frac{2}{3}\)
問題 3
(a)
考え方と計算過程: \(Z_n \sim \mathcal{N}(0,1)\) は、確率変数 \(Z_n\) が平均 \(0\)、分散 \(1\) の標準正規分布に従うことを意味します。 したがって、\(\mathbb{E}(Z_n) = 0\) および \(\mathbb{V}(Z_n) = 1\) です。
-
\((a)_1\): \(\mathbb{V}(Z_n)\) 定義より、\(\mathbb{V}(Z_n) = 1\)。
-
\((a)_2\): \(\mathbb{E}(-Z_n) + \mathbb{V}(Z_n)\) 期待値の線形性より \(\mathbb{E}(-Z_n) = -\mathbb{E}(Z_n) = -0 = 0\)。 よって、\(\mathbb{E}(-Z_n) + \mathbb{V}(Z_n) = 0 + 1 = 1\)。
-
\((a)_3\): \(\mathbb{V}(Z_{n-1} + Z_n)\) (独立である場合) 確率変数 \(Z_{n-1}\) と \(Z_n\) が独立であるとき、和の分散は分散の和に等しくなります。 \(\mathbb{V}(Z_{n-1} + Z_n) = \mathbb{V}(Z_{n-1}) + \mathbb{V}(Z_n)\) \(Z_{n-1} \sim \mathcal{N}(0,1)\) なので \(\mathbb{V}(Z_{n-1}) = 1\)。\(Z_n \sim \mathcal{N}(0,1)\) なので \(\mathbb{V}(Z_n) = 1\)。 よって、\(\mathbb{V}(Z_{n-1} + Z_n) = 1 + 1 = 2\)。
解答: \((a)_1 = 1\), \((a)_2 = 1\), \((a)_3 = 2\)
(b)
考え方と計算過程: \(S_n \sim \text{Bi}(n,p)\) は、\(S_n\) が試行回数 \(n\)、成功確率 \(p\) の二項分布に従うことを意味します。 - \((b)_1\): \(\mathbb{E}(S_n)\) 二項分布の期待値の公式より、\(\mathbb{E}(S_n) = np\)。
- \((b)_2\): \(\mathbb{V}(S_n)\) 二項分布の分散の公式より、\(\mathbb{V}(S_n) = np(1-p)\)。
次に、\(Z_n = \frac{S_n}{\sqrt{n}} - \mathbb{E}\left(\frac{S_n}{\sqrt{n}}\right)\) について考えます。 まず、\(\mathbb{E}\left(\frac{S_n}{\sqrt{n}}\right) = \frac{1}{\sqrt{n}}\mathbb{E}(S_n) = \frac{np}{\sqrt{n}} = p\sqrt{n}\) です。 よって、\(Z_n = \frac{S_n}{\sqrt{n}} - p\sqrt{n} = \frac{S_n - np}{\sqrt{n}}\) と書き換えられます。これは \(S_n\) を標準化した形に近いです(ただし、分母が \(\sqrt{\mathbb{V}(S_n)}\) ではなく \(\sqrt{n}\))。 \(n\) が大きい時、\(S_n\) は正規分布 \(\mathcal{N}(np, np(1-p))\) で近似され(中心極限定理の帰結)、\(Z_n = \frac{S_n - np}{\sqrt{n}}\) も正規分布で近似できます。
-
\((b)_3\): \(\mathbb{E}(Z_n)\) \(\mathbb{E}(Z_n) = \mathbb{E}\left(\frac{S_n - np}{\sqrt{n}}\right) = \frac{1}{\sqrt{n}}(\mathbb{E}(S_n) - np) = \frac{1}{\sqrt{n}}(np - np) = 0\)。 または、問題文の定義 \(Z_n = \frac{S_n}{\sqrt{n}} - \mathbb{E}\left(\frac{S_n}{\sqrt{n}}\right)\) から直接、 \(\mathbb{E}(Z_n) = \mathbb{E}\left(\frac{S_n}{\sqrt{n}}\right) - \mathbb{E}\left(\mathbb{E}\left(\frac{S_n}{\sqrt{n}}\right)\right) = \mathbb{E}\left(\frac{S_n}{\sqrt{n}}\right) - \mathbb{E}\left(\frac{S_n}{\sqrt{n}}\right) = 0\)。
-
\((b)_4\): \(\mathbb{V}(Z_n)\) \(\mathbb{V}(Z_n) = \mathbb{V}\left(\frac{S_n - np}{\sqrt{n}}\right) = \frac{1}{(\sqrt{n})^2}\mathbb{V}(S_n - np) = \frac{1}{n}\mathbb{V}(S_n)\) (定数 \(np\) を引いても分散は変わらない) \(= \frac{1}{n} (np(1-p)) = p(1-p)\)。
最後に、\(n\) が大きく \(np \approx 1\) である場合、\(S_n\) はパラメータ \(\lambda = np\) のポアソン分布で近似できます。 問題では強度 \(\lambda=1\) が指定されているので、\(S_n \sim \text{Poi}(1)\) と近似します。 ポアソン分布 \(\text{Poi}(\lambda)\) の確率質量関数は \(\mathbb{P}(X=k) = \frac{e^{-\lambda}\lambda^k}{k!}\) です。 \(\lambda=1\) のとき、\(\mathbb{P}(S_n=k) \approx \frac{e^{-1}1^k}{k!} = \frac{e^{-1}}{k!}\)。 \(\mathbb{P}(1 \leq S_n < 3) = \mathbb{P}(S_n=1) + \mathbb{P}(S_n=2)\) ( \(S_n\) は整数値を取るため) \(\mathbb{P}(S_n=1) \approx \frac{e^{-1}}{1!} = e^{-1}\) \(\mathbb{P}(S_n=2) \approx \frac{e^{-1}}{2!} = \frac{1}{2}e^{-1}\) \(\mathbb{P}(1 \leq S_n < 3) \approx e^{-1} + \frac{1}{2}e^{-1} = \left(1 + \frac{1}{2}\right)e^{-1} = \frac{3}{2}e^{-1}\)。 問題の形式 \((b)_5 e^{-\lambda}\) と比較すると、\((b)_5 = \frac{3}{2}\)。
解答: \((b)_1 = np\), \((b)_2 = np(1-p)\), \((b)_3 = 0\), \((b)_4 = p(1-p)\), \((b)_5 = \frac{3}{2}\)
問題 4
(a)
考え方と計算過程: 試験の得点 \(X\) は正規分布 \(\mathcal{N}(50, 5^2)\) に従います。つまり、平均 \(\mu=50\)点、標準偏差 \(\sigma=5\)点です。 上位5%に入るための最低点を \(x_0\) とすると、\(\mathbb{P}(X \ge x_0) = 0.05\) となります。 確率変数 \(X\) を標準化して \(Z = \frac{X-\mu}{\sigma} = \frac{X-50}{5}\) とすると、\(Z\) は標準正規分布 \(\mathcal{N}(0,1)\) に従います。 \(\mathbb{P}(X \ge x_0) = \mathbb{P}\left(\frac{X-50}{5} \ge \frac{x_0-50}{5}\right) = \mathbb{P}\left(Z \ge \frac{x_0-50}{5}\right) = 0.05\) 標準正規分布の上側5%点 \(z_{0.05}\) は、\(\mathbb{P}(Z \ge z_{0.05}) = 0.05\) を満たす \(z\) の値です。標準正規分布表などから \(z_{0.05} \approx 1.645\) です。 よって、\(\frac{x_0-50}{5} = 1.645\) \(x_0-50 = 5 \times 1.645 = 8.225\) \(x_0 = 50 + 8.225 = 58.225\) 点数は自然数で答える必要があり、「最低でも~点」なので、58.225点を超える最小の自然数を求めます。それは59点です。 解答: \((a) = 59\)
(b)
考え方と計算過程: - \((b)_1\): \(z_{\alpha/2}\) の値 \(\alpha = 2 \times 0.022750 = 0.0455\) \(\alpha/2 = 0.022750\) \(\mathbb{P}(Z > z_{\alpha/2}) = \alpha/2 = 0.022750\) これは、標準正規分布 \(Z\) の上側確率が \(0.022750\) となる点 \(z_{\alpha/2}\) を求めることを意味します。 標準正規分布の累積分布関数を \(\Phi(z)\) とすると、\(\Phi(z_{\alpha/2}) = 1 - 0.022750 = 0.97725\) です。 標準正規分布表から \(\Phi(2.0) = 0.9772\) (または \(0.97725\)) となるため、\(z_{\alpha/2} = 2.0\) です。 小数点第一位まで(二位以下切り捨て)で \(2.0\) となります。
- \((b)_2\): 必要なサンプルサイズ \((1-\alpha)\)信頼区間の幅は、標本比率 \(\hat{p}\) の場合、\(2 \times z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\) です。 ここで、信頼区間の「幅を \(\pm 0.02\) に収めたい」とは、誤差の許容範囲 (マージン・オブ・エラー) が \(0.02\) であることを意味します。 つまり、\(z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \le 0.02\) 与えられた値は、\(z_{\alpha/2}=2.0\)、サンプル比率 \(\hat{p}=1/2=0.5\) です。 \(2.0 \sqrt{\frac{0.5(1-0.5)}{n}} \le 0.02\) \(2.0 \sqrt{\frac{0.25}{n}} \le 0.02\) \(\sqrt{\frac{0.25}{n}} \le \frac{0.02}{2.0} = 0.01\) 両辺を2乗すると、 \(\frac{0.25}{n} \le (0.01)^2 = 0.0001\) \(n \ge \frac{0.25}{0.0001} = \frac{0.25}{1/10000} = 0.25 \times 10000 = 2500\) したがって、少なくとも \(2500\) のサンプルサイズが必要です。整数で答えます。
解答: \((b)_1 = 2.0\), \((b)_2 = 2500\)
(c)
考え方と計算過程: 片側検定で、帰無仮説 \(H_0: p=0.5\)(投票率が拮抗)を対立仮説 \(H_1: p > 0.5\)(ある候補者が勝利)に対して検定します。 有意水準 \(\alpha = 0.0013499\)、サンプルサイズ \(n=100\) です。 まず、この \(\alpha\) に対応する標準正規分布の臨界値 \(z_\alpha\) を求めます。\(\mathbb{P}(Z > z_\alpha) = \alpha\) です。 \(\Phi(z_\alpha) = 1 - \alpha = 1 - 0.0013499 = 0.9986501\) 標準正規分布表から、\(\Phi(3.0) \approx 0.99865\) なので、\(z_\alpha \approx 3.0\) です。 帰無仮説 \(H_0\) のもとで、標本比率 \(\hat{p}\) の標準誤差 SE は、 \(SE = \sqrt{\frac{p_0(1-p_0)}{n}} = \sqrt{\frac{0.5(1-0.5)}{100}} = \sqrt{\frac{0.25}{100}} = \frac{0.5}{10} = 0.05\) 検定統計量 \(Z_{stat} = \frac{\hat{p} - p_0}{SE} = \frac{\hat{p} - 0.5}{0.05}\) 帰無仮説が棄却されるのは、\(Z_{stat} \ge z_\alpha\) のときです。(境界値を含むとして) \(\frac{\hat{p} - 0.5}{0.05} \ge 3.0\) \(\hat{p} - 0.5 \ge 3.0 \times 0.05 = 0.15\) \(\hat{p} \ge 0.5 + 0.15 = 0.65\) 勝利する候補者が得るべき票数を \(k\) とすると、\(k = n \hat{p}\) です。 \(k \ge 100 \times 0.65 = 65\) したがって、少なくとも65票をとれば当確予想を発表することになります。整数で答えます。 解答: \((c) = 65\)