SSブログ

春のいずみ+ [データサイエンス、統計モデル]

データ解析コンペ、OR学会、DB学会最終発表、課題部門で優勝しました!(・∀・)

20120225_img01.jpg

チーム名は、"春のいずみ+"
20120225_img02.jpg

うちの息子「春飛(はるひ)」と西郷さんの娘「いずみ」を足したチーム名です。

-----
とりあえず、優勝できたことは、素直に嬉しいです。

ただ、どこのチームも僅差だったと思うので、また、別のデータでやったら、順位は変わっていたのかなぁと思います。

こだわったポイントは、バランス力です。
こういうのって、何かのモデルをとことん突き詰めていくってのもありかと思います。

一方で、精度を上げるためには、どのモデルを使うか、そして、パラメータをどうチューニングするかってことも大切ですし、変数をどのように作りこむかも大切。

また、いくつかのチームが高すぎる精度を出していましたが、オーバーフィットの問題。
つまり、頑健性や安定性の担保も必要です。

さらに、今回は、単純な精度ではなく、カテゴリの正解率に重みをかけるという、配点方式なので、精度 ≠ 総得点となっています。
どういう戦略で得点を上げていくのかも考えなければなりません。

正直、会社の分析が激忙しい中、限られた時間で最高のアウトプットを出すには?にこだわり、上記の項目にバランスよく取り組めたのが良かったのかなぁと思っています。

最後は、いかにデータと真摯に会話できたかに尽きる部分もあります。

どこに着目したら、点数が少しでも上がるのか?ってことを分析して出てきた結果をみて、色々と考えていった積み重ねが、他のチームよりもホンの少しだけ点数が高かったのではないでしょうか。

来週は、フリー部門があります。
ほとんど手をつけていませんが、、、(笑
残り1週間がんばります!

nice!(41)  コメント(3)  トラックバック(0) 
共通テーマ:学問