032_第1種の過誤、第2種の過誤、p値、有意水準の意味を理解している

解説

第1種の過誤とは、帰無仮説が正しいにもかかわらず、棄却(否定)してしまうことです。第1種の過誤が起こる確率を有意水準(危険率)といいます。([math]\alpha[/math]で表現される)有意水準は5%や1%に設定するのが一般的です。なお、有意水準が5%で検定を行うということは、第1種の過誤をおかす危険率が5%であることと同意です。

第2種の過誤とは、帰無仮説が誤っているのもかかわらず、採用してしまうことです。

p値とは、帰無仮説を棄却するための証拠を測定する確率のことです。そのため、確率が低ければ低いほど帰無仮説を棄却する証拠になります。p値と[math]\alpha[/math]を比較することで、帰無仮説が棄却されるかどうかを判断できます。 例えば、p値が[math]0.01[/math]で、[math]\alpha[/math]が[math]0.05[/math]の場合は、帰無仮説を棄却することになります。

ステップアップ

・検定の流れは以下のとおりで、本記事で紹介する第1種の過誤や第2種の過誤は、⑤を計算した結果、⑥で生じる過誤の話となります。全体感を把握し、どのステップでの話題なのかを今一度確認しましょう。

①仮説を立てる
帰無仮説:H0
対立仮説:H1
②有意水準の設定
③標本抽出
④検定統計量Xの計算
⑤有意水準より棄却域を計算
⑥検定統計量Xと棄却域を比較
検定統計量X<棄却域:H0は棄却できない
検定統計量X<棄却域:H0が棄却棄却され、H1が採用される

・[math]p<0.05[/math]にすることだけを目的とし、合理的な理由もなく統計分析手法をあれこれ手当たり次第に試す「p-value hacking」や、[math]p<0.05[/math]ではなかっただけで論文誌の査読がされない等の「file-drawer effect」が最近では問題になっているようです。

キーワード

  • 第1種の過誤
  • 第2種の過誤
  • p値
  • 有意水準
  • *p-value hacking
  • *file-drawer effect

ソースコード

データセット

関連する記事