SSブログ

「交絡」と「共変量」の違い [データサイエンス、統計モデル]

統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。

【質問】
「交絡」と「共変量」の違いは?

【回答】
自分もこの辺りは曖昧だったので、共変量、交絡変数について、いくつかの論文等参照しました。
分野によって呼び方が違うものの同じ意味で使っているケースが多く見られます。

学者Aは変数Xを「交絡因子」として分類し、学者Bは同じ意味で「共変量」として書かれています。

いずれにせよ、数学的/解析的には、大きな違いはなく、同じモデルとして扱い、統計ソフトウェアでも同じ方法で解析することができます。

因果推論に興味がある場合は、これらの統計用語は厳密に定義されており、
例えば、「共変量」の中で特定の条件に一致している場合、交絡している共変量という言い方になります。

http://www.dagitty.net/learn/graphs/roles.html

こちらのサイトが分かりやすかったです。
用語の定義と確認問題があります。

Exposure:相関関係(原因ではない)
Outcome:結果(yのこと)
Confounders:交絡因子
Mediators:介在変数
Proxy Confounders:代理交絡因子
Competing Exposures:競合変数(精度向上のために必要な変数)

nice!(0)  コメント(0) 
共通テーマ:学問

nice! 0

コメント 0