商用ツールか、フリーのツールか [データサイエンス、統計モデル]
「R+Pythonというアプローチ」という記事を書きましたが、
http://skellington.blog.so-net.ne.jp/2013-12-10
自分自身の分析が
R+Pythonというアプローチ
に移行したというわけではないです。
いくつかのコンペティション(国内や海外)に出たり、日々の業務の中で、数多くのモデリングを行い、単に精度やマーケティング思考のやりやすさ、安定性を考えた場合、
IBM SPSS Modeler(旧称クレメンタイン)
がベストだと思っています。
(※ IBMの回し者ではないです…)
もちろん、個人や学生の人にとって見れば、価格が高すぎるので、そこが問題点であり、R+Pythonが流行ってきている理由もそこにあります。
"精度"ということを考えた場合、最新の手法や様々な手法が豊富なRの方に軍配が上がるように思えるのですが、意外とSPSS Modelerも悪くない、というか、むしろ精度が高い場合が多いように感じます。
おそらく、単なるアルゴリズム云々という話ではなく、きちんとした特徴量(説明変数)を作れれば、あまり、アルゴリズムや手法には差がなくなってくるのではないか?と。
そして、アルゴリズムの豊富さという意味では、昔に比べ、IBM SPSS Modelerも十分に良いノードがそろってきていると思います。
なので、主としては、IBM SPSS Modelerを使い、気分転換として、R+Pythonを使うのが、今のところ自分自身の中でのベストアプローチですね。
http://skellington.blog.so-net.ne.jp/2013-12-10
自分自身の分析が
R+Pythonというアプローチ
に移行したというわけではないです。
いくつかのコンペティション(国内や海外)に出たり、日々の業務の中で、数多くのモデリングを行い、単に精度やマーケティング思考のやりやすさ、安定性を考えた場合、
IBM SPSS Modeler(旧称クレメンタイン)
がベストだと思っています。
(※ IBMの回し者ではないです…)
もちろん、個人や学生の人にとって見れば、価格が高すぎるので、そこが問題点であり、R+Pythonが流行ってきている理由もそこにあります。
"精度"ということを考えた場合、最新の手法や様々な手法が豊富なRの方に軍配が上がるように思えるのですが、意外とSPSS Modelerも悪くない、というか、むしろ精度が高い場合が多いように感じます。
おそらく、単なるアルゴリズム云々という話ではなく、きちんとした特徴量(説明変数)を作れれば、あまり、アルゴリズムや手法には差がなくなってくるのではないか?と。
そして、アルゴリズムの豊富さという意味では、昔に比べ、IBM SPSS Modelerも十分に良いノードがそろってきていると思います。
なので、主としては、IBM SPSS Modelerを使い、気分転換として、R+Pythonを使うのが、今のところ自分自身の中でのベストアプローチですね。