SSブログ

データサイエンティストというブーム [マーケティング / 仕事]

最近、データサイエンティストとかビッグデータという言葉が良い意味でも悪い意味でもブームになっている気がします。

「データサイエンティストとは?」と聞かれたので、自分なりに考えてみました。

自分がデータサイエンティストかどうかは置いておいて、社内の肩書はデータサイエンティストとなっています。
しかし、それがいったい何か?と聞かれれば、「う~ん。」と言葉に詰まってしまいます。

データサイエンス、データサイエンティストという言葉が出てくる少し前に、データマイニングとかデータマイナーという言葉が流行りました。
それとは、少し違う気がします。

また、往来からある言葉として、アナリストとか統計家という言葉もあります。

米国の経営誌『ハーバード・ビジネス・レビュー』(2012年10月号)によると、
21世紀で最もセクシーな職業は、データサイエンティスト(Data Scientist)だ。

と書かれています。

少し前(2009年)に有名になったのは、Google の Chief Economist である Hal Varian が言った言葉。
I keep saying that the sexy job in the next 10 years will be statisticians.


ここでは、データサイエンティストという言葉ではなく、統計学者という言葉です。

自分の感覚的にも2009年には、データサイエンスというブームが来ていると実感はなく、この間に急激に騒がれ始めたと感じています。

話を戻して、データマイニングという言葉が出てきた背景として、

・大量データ(この頃は、ビッグデータという言葉ではなかった)の中から、往来の統計学の手法とは別に、マシンの力を使って、ビジネスに役立つ(お金を生み出す)何かをマイニングする(発掘する)。

・データが計画的に生成されたものではなく、いろんなデータがまぜこぜなので、そもそも往来の統計手法は使えない問題に遭遇する。

・統計は、有意かどうか検定を行うが、データ数が多いので、なんでもかんでも有意になりやすい。だとすると、「よりよいモデルは何か?」を選択する必要がある。

このような背景のもと、データマイニングという言葉が生まれ、それらを扱う人は、データマイナーと呼ばれるようになったと思います。

ベン図で考えると、統計とデータマイニングは、かぶっている部分は多いものの、微妙にかぶっていない部分も存在する、そんな関係な気がします。

次に、データサイエンスやデータサイエンティストという言葉が出てきた背景も何らかの技術的な要因があると考えると、

・ビッグデータを扱う Hadoop が出てきた。

・Rというフリーソフトがそこそこ大きいデータを扱えるようになってきた。

・何やら Python もブームっぽい。

・IT屋さんがハードを売るために格好良い言葉が必要だった?
(これは言い過ぎか…w)

アナリスト、データマイナー、データサイエンティスト。
色々な肩書で呼ばれていますが、自分自身のスキルも微妙に時代の変化、求められるスキル、自分が求めたいスキルに応じて、意識的に変えてきました。

しかし、データ分析における大切なものは、呼び名が変わっても変わらない本質があると思います。

長くなったので、続く…。
nice!(7)  コメント(0)  トラックバック(0) 
共通テーマ:仕事