自然科学の統計学 (基礎統計学) ~主な検定と検出力 [データサイエンス、統計モデル]
こちらを読み進めていますが、その備忘録として。
6. 検定と標本の大きさ
6.2 主な検定と検出力
p値を否定する人の意見として、
データ数が大きくなれば、少しずれただけで検出が100%になってしまう。
⇒ データ数が多ければ、どんな検定も有意になる。
しかし、元々の検定の発想(立場)から考えると、「それは問題ではなく、そりゃそうだよね。」という自然な結論になる。
回帰分析でt値が出てくる理由
誤差が既知というのは普通はないので、分散が未知である場合のt検定になる
t分布は正規分布に比べて裾が重い分布になるが、nが30くらいあるとz検定と同じくらいになる
中心t分布と非心t分布
検出力を一番よくしたい
⇒ 差を取ったり比を取ったりする
フィッシャーは、色々な検定も提唱したが、誰も使っていない。(正しいのだが・・・)
フィッシャーの正確確率検定だけは生き残った。
条件付き検定
周辺度数を固定した時の確率分布は超幾何分布に従う
2×2分割表の自由度は1
当時は、フィッシャーが提案した時に、ものすごく論争になったが、最近では落ち着いている。
今でも20年に1回くらいは議論になっている。
6. 検定と標本の大きさ
6.2 主な検定と検出力
p値を否定する人の意見として、
データ数が大きくなれば、少しずれただけで検出が100%になってしまう。
⇒ データ数が多ければ、どんな検定も有意になる。
しかし、元々の検定の発想(立場)から考えると、「それは問題ではなく、そりゃそうだよね。」という自然な結論になる。
回帰分析でt値が出てくる理由
誤差が既知というのは普通はないので、分散が未知である場合のt検定になる
t分布は正規分布に比べて裾が重い分布になるが、nが30くらいあるとz検定と同じくらいになる
中心t分布と非心t分布
検出力を一番よくしたい
⇒ 差を取ったり比を取ったりする
フィッシャーは、色々な検定も提唱したが、誰も使っていない。(正しいのだが・・・)
フィッシャーの正確確率検定だけは生き残った。
条件付き検定
周辺度数を固定した時の確率分布は超幾何分布に従う
2×2分割表の自由度は1
当時は、フィッシャーが提案した時に、ものすごく論争になったが、最近では落ち着いている。
今でも20年に1回くらいは議論になっている。