統計学概論 多変量解析 [データサイエンス、統計モデル]
備忘録
区間推定
平均だけでなく、メディアンなどの統計量についても区間推定できる
相関と原因は別物
相関は、1つの証拠でしかない
検定
有意水準の取り方によって結果が変わる
グレーなものに白黒をつけるのが検定 ⇒ はたしてそれで良いのか?
AICはデータが多いと、たくさんの変数を選んでくる
データ数に依存してしまう
数量化Ⅰ類の陥りやすい過ち
3つのカテゴリがある場合、t値は意味がない
どのカテゴリを基準にするかでt値が変わってしまう
判別分析
最近では、ロジットモデルを使う傾向にある
ロジットはyが0~1の間に入るが、数量化の場合はその保証がない
普及率の推測
ロジットを使った変数変換をして、最小二乗法で解くことができる
頭打ちなどを表現する場合は、シーリング変数をつける
確率の予測
離散型二項ロジットモデル
最尤法を使って解く
誤差が正規分布をしている場合のみ最尤法と最小二乗法は一致する
二項ロジットモデルを使ったマーケティング
二重指数分布
離散選択分析理論とその計算手法の開発でノーベル経済学賞を2000年に受賞した
時系列モデルと確率過程モデル
理論研究では確率過程モデルの圧勝
区間推定
平均だけでなく、メディアンなどの統計量についても区間推定できる
相関と原因は別物
相関は、1つの証拠でしかない
検定
有意水準の取り方によって結果が変わる
グレーなものに白黒をつけるのが検定 ⇒ はたしてそれで良いのか?
AICはデータが多いと、たくさんの変数を選んでくる
データ数に依存してしまう
数量化Ⅰ類の陥りやすい過ち
3つのカテゴリがある場合、t値は意味がない
どのカテゴリを基準にするかでt値が変わってしまう
判別分析
最近では、ロジットモデルを使う傾向にある
ロジットはyが0~1の間に入るが、数量化の場合はその保証がない
普及率の推測
ロジットを使った変数変換をして、最小二乗法で解くことができる
頭打ちなどを表現する場合は、シーリング変数をつける
確率の予測
離散型二項ロジットモデル
最尤法を使って解く
誤差が正規分布をしている場合のみ最尤法と最小二乗法は一致する
二項ロジットモデルを使ったマーケティング
二重指数分布
離散選択分析理論とその計算手法の開発でノーベル経済学賞を2000年に受賞した
時系列モデルと確率過程モデル
理論研究では確率過程モデルの圧勝