SSブログ

Rのアソシエーション分析で新しい項目が追加 [データサイエンス、統計モデル]

統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。

【質問】
Rのaprioriを実行したところ、coverageという項目がありますが、この計算方法は何ですか?

【回答】
自分のR(古いバージョン)だとcoverageという項目がなく、ちょっと焦りましたが・・・

これまで出力されていた指標
lhs, rhs, support, confidence, lift, count

support:支持度
confidence:確信度
lift:リフト

新たに、coverageが追加されています。

調べてみると、意外と簡単な計算でした。

A⇒Bのcoverageの計算方法は
P(A) = n(A) / N(全体の人数)
で計算できます。

例えば、「オムツを買う → ビールを買う」というルールを考える場合、
1000人中、オムツを買った人の人数を100人とすると、
N:1000
n(A)=100
よって、coverageは、100/1000=0.1となります。
ビールを買うという右側のルールは見ていないことに注意です。

nice!(3)  コメント(0) 
共通テーマ:学問

nice! 3

コメント 0