KXENとVapnikさん [次世代型データマイニングエンジン「KXEN」]
KXENのCTO、CEOの方が来訪されました。
両方ともフランス人らしく、時差ボケボケっぽかったですが。(・∀・)
興味があったのは、Vapnikさんの話。
Vapnikさんは、サポートベクターマシン作った人ですが、KXENに搭載されているアルゴリズムもVapnikさんによるもの。
サポートベクターマシンではなく、SRM原理というものが元になっているそうです。
個人的には、Vapnikさんに会ってみたかったです。w
確かに、色々なデータで試してみましたが、精度は抜群に良いです。
データ加工部分がSQLベースなので、SAS、SPSS Clementine、数理システムの VMS のようなハンドリングは難しいですが、今後の課題でしょう。
今のところ、両方併用するのが最良かな。
その後は、ベイジアンネットの打ち合わせ、メディアの学校と断続的にミーティングがあり、結局、お昼ご飯にありつけたのは、3時過ぎですた。。。
お腹すいた~。(*´д`*)
K2R(Robust Regression)の精度比較 [次世代型データマイニングエンジン「KXEN」]
久々に出勤。
GWボケでポッポッポー鳩ポッポーって感じです。
そういえば、KXENを借りっぱなしになっているなぁ。
そこで、過去のプロジェクトで使ったデータを引っ張り出してきて
ニューラルネットワーク、決定木、そして、KXENのRobust Regressionと比較することにした。
モデル作成用とモデル検証用に分けて分析。
大量データと少量データでどれくらいの差が出るんだろうか。
一度に複数のモデルが簡単にできるのがKXENの売りであるが、簡単でもどれくらいの精度が保てるのかが非常に気になるところである。
モデルを作る手間というのは、圧倒的に楽である。
レポートも自動で作成してくれる。
そして、気になる精度であるが、手間と時間をかけると精度は同じである。
手間と暇をかけて同じ精度だったら、むしろ悲しい。。。
しかし、高速バージョンでモデルを作ると、KXENの方が圧倒的に精度が良かった。
つまり、大量にたくさんのモデルを作成する必要がある場合、KXENを使えば、大幅に時間を短縮することができる。
しかし、KXENにも短所があり、モデルの中身がブラックボックスという点である。
当たればいいやという状況においては、問題ないのであるが、そのモデルの構造を知る必要がある場合は、なかなか難しい。
次世代型データマイニングエンジン「KXEN」 [次世代型データマイニングエンジン「KXEN」]
次世代型データマイニングエンジン「KXEN」
http://www.kxensolutions.jp/
KXENを1ヶ月ほど借りることができた。
なんでも、サポートベクターマシンを作った数学者が開発したツールであるとか。
Clementine(クレメンタイン)やEnterprise Miner(エンタープライズマイナー)などは、複数のモデル作成ノードが組み込まれているが、このKXENは、Robust Regressionのみとなっている。
せっかくなので、他のマイニングツールと比べて、どれくらいの精度が確保できるのか試してみたい。
ところで、こういう海外のツールを日本に持ってきた場合、日本語化の部分でエラーが出るのは付き物なんだろうか。
変数を上手く読み込むことができなかった。。。(*`д´*)
SASやAccessの様に構造化したものであれば、読み込むことが出来るらしい。
また、日付データは
yyyy/mm/dd hh:mm:ss
yyyy-mm-dd hh:mm:ss
の形で保存しておく必要があるようだ。
データの読み込みに苦戦していて、なかなかマイニングに取り掛かれないなぁ。
(*´д`*)