SSブログ

○○日以内の関連性をみる時系列アソシエーション [データサイエンス、統計モデル]

時系列アソシエーション分析をした。

時系列アソシエーションとは、1ヶ月間のデータを取ってきて
A ⇒ B
という時系列を加味したアソシエーションルールのこと。

通常のアソシエーションルールは、時系列を考えないので、
Aが先でもBが先でも関係なく、AとBの関連性をみるものだ。
いわゆるマーケットバスケット分析。

時系列の関連性を見たい場合、時系列アソシエーションをする必要があるのだが、
1ヶ月とか1年とかのデータを持ってきた場合、ちょっと変なことが起こるのだ。

SPSS社の Clementine や数理システム社の VMS(Visual Mining Studio) の両方とも、○○日以内の関連性を見るってことができない。

つまり、1年とかのデータを流した場合、2ヶ月も3ヶ月も離れたアイテムの影響が出てきてしまう。
感覚的に数日とか長くても1週間くらいの影響を受けるアイテムの分析なので、データは、1ヶ月とか1年とか使うのだが、○○日以内のアイテムに関してルールを計算するという処理がしたいのだ。

仕方ないので、自分で作ることにした。Ψ(`∀´)Ψ
こうすることで、長期のデータを使いつつも、○○日以内のアイテムに関してルールを作ることができる。

ちなみに、時系列アソシエーションの速度を Clementine と Visual Mining Studio で比較したところ、圧倒的に Visual Mining Studio の方が計算が速かった。

nice!(0) 
共通テーマ:学問

nice! 0