Rのアソシエーション分析で新しい項目が追加 [データサイエンス、統計モデル]
統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
Rのaprioriを実行したところ、coverageという項目がありますが、この計算方法は何ですか?
【回答】
自分のR(古いバージョン)だとcoverageという項目がなく、ちょっと焦りましたが・・・
これまで出力されていた指標
lhs, rhs, support, confidence, lift, count
support:支持度
confidence:確信度
lift:リフト
新たに、coverageが追加されています。
調べてみると、意外と簡単な計算でした。
A⇒Bのcoverageの計算方法は
P(A) = n(A) / N(全体の人数)
で計算できます。
例えば、「オムツを買う → ビールを買う」というルールを考える場合、
1000人中、オムツを買った人の人数を100人とすると、
N:1000
n(A)=100
よって、coverageは、100/1000=0.1となります。
ビールを買うという右側のルールは見ていないことに注意です。
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
Rのaprioriを実行したところ、coverageという項目がありますが、この計算方法は何ですか?
【回答】
自分のR(古いバージョン)だとcoverageという項目がなく、ちょっと焦りましたが・・・
これまで出力されていた指標
lhs, rhs, support, confidence, lift, count
support:支持度
confidence:確信度
lift:リフト
新たに、coverageが追加されています。
調べてみると、意外と簡単な計算でした。
A⇒Bのcoverageの計算方法は
P(A) = n(A) / N(全体の人数)
で計算できます。
例えば、「オムツを買う → ビールを買う」というルールを考える場合、
1000人中、オムツを買った人の人数を100人とすると、
N:1000
n(A)=100
よって、coverageは、100/1000=0.1となります。
ビールを買うという右側のルールは見ていないことに注意です。
コメント 0