SSブログ

平成21年度データ解析コンペティション発会式 [データサイエンス、統計モデル]

平成21年度データ解析コンペティション発会式に行って来た。

今年のコンペのデータは、『都市百貨店のID付POSデータ』だった。
マルイのデータらしい。

平成16年度から、かれこれ5年くらい参加しているが、ID付POSデータでの参加は初めて。
楽しみだったりする。

その後、講演会として、
・ 森田裕之氏(大阪府立大学):マイニングとグラフ
・矢島安敏氏((株)ブレインパッド):マーケティング領域におけるレコメンド技術のビジネス展開
の講演があった。

偶然にも矢島先生の講演内容もグラフに近い話。
その他には、Kernel法によるデータ分析の話もされていた。

何かを予測するときに、IDと属性と反応するかしないかってテーブルを作って分析するのが一般的で、その後、回帰分析などに持ち込んだりする。

それとは対照的に、Kernel法によるデータ分析では、データ間の類似性(内積)を使ってKernel行列を構築する。
この方法だと、出来上がるテーブルのイメージは、IDとIDの類似度が出来上がり、そこからSVM(サポートベクターマシン)などのモデルを構築していくというもの。

先日、ある事業のモデルを構築したのだが、実は同じようなデータ間の類似性を用いる方法でモデルを作った。
現在、SPSS Clementine や 数理システムのVMSでは、ID、属性、目的変数といったテーブルを作って回帰などをするというノードしか用意されていないのが残念だ。
⇒ ノードとして用意されていないので、自分で作る必要がある。

nice!(0) 
共通テーマ:学問

nice! 0