コンテンツにスキップ

第1章:記述統計 演習問題 解答例

第1回:データの種類と要約統計量

  1. 基本的な理解を確認する問題:
  2. 量的データと質的データの違い:

    • 量的データ:数値で表されるデータ(例:身長、体重、テストの点数)
    • 質的データ:カテゴリーや属性で表されるデータ(例:性別、血液型、好きな色)
  3. 平均値、中央値、最頻値の違い:

    • 平均値:全データの合計をデータ数で割った値。外れ値の影響を受けやすい
    • 中央値:データを小さい順に並べたときの中央の値。外れ値の影響を受けにくい
    • 最頻値:最も頻繁に出現する値。データの分布の特徴を表す
  4. 計算問題の解答: データ:5, 7, 3, 8, 5, 6, 4, 5, 9, 7

  5. 平均値:5.9
  6. 中央値:5.5
  7. 最頻値:5

第2回:散布図と相関

  1. 基本的な理解を確認する問題:
  2. 散布図の見方と相関係数:

    • 散布図:2つの変数の関係を視覚的に表現
    • 相関係数:-1から1の値を取り、1に近いほど正の相関、-1に近いほど負の相関
  3. 相関係数の特徴:

    • 1に近い場合:右上がりの直線的な関係
    • -1に近い場合:右下がりの直線的な関係
  4. 計算問題の解答: データ: X: 1, 2, 3, 4, 5 Y: 2, 4, 6, 8, 10

  5. 相関係数:1.0(完全な正の相関)

第3回:回帰分析の基礎

  1. 基本的な理解を確認する問題:
  2. 回帰直線:

    • 2変量データの関係を表す直線
    • 最小二乗法:各点から直線までの距離の二乗和を最小にする
  3. 決定係数\(R^2\)

    • 回帰直線の当てはまりの良さを表す指標
    • 相関係数\(r\)の二乗に等しい
  4. 計算問題の解答: データ: X: 1, 2, 3, 4, 5 Y: 2, 4, 6, 8, 10

  5. 回帰直線:\(Y = 2X + 0\)
  6. 決定係数\(R^2\):1.0
  7. 相関係数\(r\):1.0(\(R^2 = r^2\)が成り立つ)

発展問題

  1. 実践的な問題の解答: データ: 数学: 65, 70, 75, 80, 85, 90, 95 英語: 60, 65, 70, 75, 80, 85, 90
  2. 数学:平均値 80、標準偏差 10
  3. 英語:平均値 75、標準偏差 10
  4. 相関係数:1.0
  5. 回帰直線:\(Y = X - 5\)
  6. 決定係数:1.0

  7. 応用問題の解答: データ: 製造時間(分): 10, 12, 11, 13, 12, 14, 11, 13, 12, 11 不良品数(個): 2, 3, 2, 4, 3, 5, 2, 4, 3, 2

  8. 相関係数:0.89(強い正の相関)
  9. 回帰直線:\(Y = 0.5X - 3\)
  10. 決定係数:0.79
  11. 製造時間15分の予測値:4.5個