SSブログ

自然科学の統計学 (基礎統計学) ~主な検定と検出力 [データサイエンス、統計モデル]

こちらを読み進めていますが、その備忘録として。


自然科学の統計学 (基礎統計学)

自然科学の統計学 (基礎統計学)

  • 作者:
  • 出版社/メーカー: 東京大学出版会
  • 発売日: 1992/08
  • メディア: 単行本



6. 検定と標本の大きさ
6.2 主な検定と検出力

p値を否定する人の意見として、
データ数が大きくなれば、少しずれただけで検出が100%になってしまう。
⇒ データ数が多ければ、どんな検定も有意になる。

しかし、元々の検定の発想(立場)から考えると、「それは問題ではなく、そりゃそうだよね。」という自然な結論になる。

回帰分析でt値が出てくる理由
誤差が既知というのは普通はないので、分散が未知である場合のt検定になる

t分布は正規分布に比べて裾が重い分布になるが、nが30くらいあるとz検定と同じくらいになる

中心t分布と非心t分布

検出力を一番よくしたい
⇒ 差を取ったり比を取ったりする

フィッシャーは、色々な検定も提唱したが、誰も使っていない。(正しいのだが・・・)
フィッシャーの正確確率検定だけは生き残った。
条件付き検定
周辺度数を固定した時の確率分布は超幾何分布に従う
2×2分割表の自由度は1

当時は、フィッシャーが提案した時に、ものすごく論争になったが、最近では落ち着いている。
今でも20年に1回くらいは議論になっている。