SSブログ

商用ツールか、フリーのツールか [データサイエンス、統計モデル]

「R+Pythonというアプローチ」という記事を書きましたが、
http://skellington.blog.so-net.ne.jp/2013-12-10
自分自身の分析が
R+Pythonというアプローチ
に移行したというわけではないです。

いくつかのコンペティション(国内や海外)に出たり、日々の業務の中で、数多くのモデリングを行い、単に精度やマーケティング思考のやりやすさ、安定性を考えた場合、

IBM SPSS Modeler(旧称クレメンタイン)

がベストだと思っています。
(※ IBMの回し者ではないです…)

もちろん、個人や学生の人にとって見れば、価格が高すぎるので、そこが問題点であり、R+Pythonが流行ってきている理由もそこにあります。

"精度"ということを考えた場合、最新の手法や様々な手法が豊富なRの方に軍配が上がるように思えるのですが、意外とSPSS Modelerも悪くない、というか、むしろ精度が高い場合が多いように感じます。

おそらく、単なるアルゴリズム云々という話ではなく、きちんとした特徴量(説明変数)を作れれば、あまり、アルゴリズムや手法には差がなくなってくるのではないか?と。

そして、アルゴリズムの豊富さという意味では、昔に比べ、IBM SPSS Modelerも十分に良いノードがそろってきていると思います。

なので、主としては、IBM SPSS Modelerを使い、気分転換として、R+Pythonを使うのが、今のところ自分自身の中でのベストアプローチですね。