ビッグデータの正体 情報の産業革命が世界のすべてを変える [データサイエンス、統計モデル]
ビクター・マイヤー=ショーンベルガー(Viktor Mayer-Schönberger)氏が書いた本。
彼の書いた本を読んだことはありませんが、、、たまたま講演を聞くことが出来ました。
いくつか面白かったポイントを自分なりにまとめなおしました。
● Google、インフルエンザの予測
政府の統計レポートだと、予測レポートが出てくるまでにかなりの時間を要します。
しかし、Gooleに検索するキーワードの情報から、かなりの精度でインフルエンザがどれくらい流行するかを予測できる。
しかも、リアルタイムで。
しかし、Googleも2012年に大きく予測を外してしまう。
「過去に作ったモデルの更新を怠った」というのが主な原因らしい。
本来は、インフルエンザにかかった人、かかった可能性が高い人が検索をするのだが、
テレビでインフルエンザの特集をしたために、全然インフルエンザと関係ない人もそのキーワードを入力し、かなり高めの予測を出してしまった、ということだった。
後は、豚インフルエンザ(新型インフルエンザ)の時も精度が悪くなっている。
ここで重要なのは、キーワードとインフルエンザ流行の相関はあるが、それが原因ではないということだ。
人がキーワードを入力するとインフルエンザにかかるわけではない。
あくまでもインフルエンザに関するキーワードの入力数とインフルエンザの流行に相関があるというだけである。
● Farecast.com
飛行機のチケットの価格が上がるか下がるかを予測するサイト。
マイクロソフトは、$115M(約120億円)で買収した。
Oren Etzioniは、航空機チケットのサイトをマイクロソフトに売却した後は、Decide.com(ショッピングアドバイスサイト)を作り、こちらは、e-bay(オークションサイト)に売却した。
飛行機のチケット価格を予測するだけでなく、今、買うべきかそうでないかを教えてくれるのが良い。
ちなみに、このプロジェクトの名前は、Hamletらしい。
ハムレットに出てくる有名なセリフとして、"to be or not to be that is the question"があります。
これを文字って、
"to buy or not to buy that is the question"
Farecast.comは、マイクロソフトが購入しました。
一方、Googleは、そこで、Googleは、旅行システムを買収し、大量のトランザクションデータを手に入れました。
つまり、アルゴリズムよりもデータが大切だと考えたわけです。
彼の書いた本を読んだことはありませんが、、、たまたま講演を聞くことが出来ました。
いくつか面白かったポイントを自分なりにまとめなおしました。
● Google、インフルエンザの予測
政府の統計レポートだと、予測レポートが出てくるまでにかなりの時間を要します。
しかし、Gooleに検索するキーワードの情報から、かなりの精度でインフルエンザがどれくらい流行するかを予測できる。
しかも、リアルタイムで。
しかし、Googleも2012年に大きく予測を外してしまう。
「過去に作ったモデルの更新を怠った」というのが主な原因らしい。
本来は、インフルエンザにかかった人、かかった可能性が高い人が検索をするのだが、
テレビでインフルエンザの特集をしたために、全然インフルエンザと関係ない人もそのキーワードを入力し、かなり高めの予測を出してしまった、ということだった。
後は、豚インフルエンザ(新型インフルエンザ)の時も精度が悪くなっている。
ここで重要なのは、キーワードとインフルエンザ流行の相関はあるが、それが原因ではないということだ。
人がキーワードを入力するとインフルエンザにかかるわけではない。
あくまでもインフルエンザに関するキーワードの入力数とインフルエンザの流行に相関があるというだけである。
● Farecast.com
飛行機のチケットの価格が上がるか下がるかを予測するサイト。
マイクロソフトは、$115M(約120億円)で買収した。
Oren Etzioniは、航空機チケットのサイトをマイクロソフトに売却した後は、Decide.com(ショッピングアドバイスサイト)を作り、こちらは、e-bay(オークションサイト)に売却した。
飛行機のチケット価格を予測するだけでなく、今、買うべきかそうでないかを教えてくれるのが良い。
ちなみに、このプロジェクトの名前は、Hamletらしい。
ハムレットに出てくる有名なセリフとして、"to be or not to be that is the question"があります。
これを文字って、
"to buy or not to buy that is the question"
Farecast.comは、マイクロソフトが購入しました。
一方、Googleは、そこで、Googleは、旅行システムを買収し、大量のトランザクションデータを手に入れました。
つまり、アルゴリズムよりもデータが大切だと考えたわけです。