第1章:記述統計 演習問題 解答例
第1回:データの種類と要約統計量
- 基本的な理解を確認する問題:
-
量的データと質的データの違い:
- 量的データ:数値で表されるデータ(例:身長、体重、テストの点数)
- 質的データ:カテゴリーや属性で表されるデータ(例:性別、血液型、好きな色)
-
平均値、中央値、最頻値の違い:
- 平均値:全データの合計をデータ数で割った値。外れ値の影響を受けやすい
- 中央値:データを小さい順に並べたときの中央の値。外れ値の影響を受けにくい
- 最頻値:最も頻繁に出現する値。データの分布の特徴を表す
-
計算問題の解答: データ:5, 7, 3, 8, 5, 6, 4, 5, 9, 7
- 平均値:5.9
- 中央値:5.5
- 最頻値:5
第2回:散布図と相関
- 基本的な理解を確認する問題:
-
散布図の見方と相関係数:
- 散布図:2つの変数の関係を視覚的に表現
- 相関係数:-1から1の値を取り、1に近いほど正の相関、-1に近いほど負の相関
-
相関係数の特徴:
- 1に近い場合:右上がりの直線的な関係
- -1に近い場合:右下がりの直線的な関係
-
計算問題の解答: データ: X: 1, 2, 3, 4, 5 Y: 2, 4, 6, 8, 10
- 相関係数:1.0(完全な正の相関)
第3回:回帰分析の基礎
- 基本的な理解を確認する問題:
-
回帰直線:
- 2変量データの関係を表す直線
- 最小二乗法:各点から直線までの距離の二乗和を最小にする
-
決定係数\(R^2\):
- 回帰直線の当てはまりの良さを表す指標
- 相関係数\(r\)の二乗に等しい
-
計算問題の解答: データ: X: 1, 2, 3, 4, 5 Y: 2, 4, 6, 8, 10
- 回帰直線:\(Y = 2X + 0\)
- 決定係数\(R^2\):1.0
- 相関係数\(r\):1.0(\(R^2 = r^2\)が成り立つ)
発展問題
- 実践的な問題の解答: データ: 数学: 65, 70, 75, 80, 85, 90, 95 英語: 60, 65, 70, 75, 80, 85, 90
- 数学:平均値 80、標準偏差 10
- 英語:平均値 75、標準偏差 10
- 相関係数:1.0
- 回帰直線:\(Y = X - 5\)
-
決定係数:1.0
-
応用問題の解答: データ: 製造時間(分): 10, 12, 11, 13, 12, 14, 11, 13, 12, 11 不良品数(個): 2, 3, 2, 4, 3, 5, 2, 4, 3, 2
- 相関係数:0.89(強い正の相関)
- 回帰直線:\(Y = 0.5X - 3\)
- 決定係数:0.79
- 製造時間15分の予測値:4.5個