SSブログ

ビデオリサーチのサンプル世帯が600人で良い理由 [データサイエンス、統計モデル]

朝野煕彦先生の『ビッグデータの使い方・活かし方―マーケティングにおける活用事例』を読んでいる。


ビッグデータの使い方・活かし方―マーケティングにおける活用事例

ビッグデータの使い方・活かし方―マーケティングにおける活用事例

  • 作者: 朝野 煕彦
  • 出版社/メーカー: 東京図書
  • 発売日: 2014/01
  • メディア: 単行本



本の中に書かれていましたが、首都圏における視聴率のサンプル世帯って600世帯らしい。

意外と少ないと感じたのだが、統計的にはそれくらいの対象者でも大丈夫って判断なのでしょう。

まず、視聴率の誤差を考えます。

視聴率の誤差が一番大きい時は、視聴率が50%の時。
逆に、誤差が0%に近づく、あるいは、100%に近づく時は、誤差が小さくなっていきます。

感覚的には、黒か白か、はっきりしないちょうど50%の確率の時に、サンプル数が一番必要になるってことなんでしょう。

標本誤差の計算方法としては、

標本誤差 = ±√(世帯視聴率(100-世帯視聴率)/標本数)
です。

標本数が600の時、世帯視聴率に対しての標本誤差は、
5%: 1.8%
10%: 2.4%
20%: 3.3%
30%: 3.7%
40%: 4.0%
50%: 4.1%
となります。

視聴率の大半が、10%~20%って考えると、視聴率の誤差は、2.4%~3.3%程度ってことが言えますね。

ということは、先週から視聴率が1%~2%上がったとか下がったって議論は、
「それって誤差の範囲内でしょう?」
とも言えますね。

nice!(41)  コメント(0)  トラックバック(0) 
共通テーマ:学問

nice! 41

コメント 0

トラックバック 0