ビデオリサーチのサンプル世帯が600人で良い理由 [データサイエンス、統計モデル]
朝野煕彦先生の『ビッグデータの使い方・活かし方―マーケティングにおける活用事例』を読んでいる。
本の中に書かれていましたが、首都圏における視聴率のサンプル世帯って600世帯らしい。
意外と少ないと感じたのだが、統計的にはそれくらいの対象者でも大丈夫って判断なのでしょう。
まず、視聴率の誤差を考えます。
視聴率の誤差が一番大きい時は、視聴率が50%の時。
逆に、誤差が0%に近づく、あるいは、100%に近づく時は、誤差が小さくなっていきます。
感覚的には、黒か白か、はっきりしないちょうど50%の確率の時に、サンプル数が一番必要になるってことなんでしょう。
標本誤差の計算方法としては、
標本誤差 = ±√(世帯視聴率(100-世帯視聴率)/標本数)
です。
標本数が600の時、世帯視聴率に対しての標本誤差は、
5%: 1.8%
10%: 2.4%
20%: 3.3%
30%: 3.7%
40%: 4.0%
50%: 4.1%
となります。
視聴率の大半が、10%~20%って考えると、視聴率の誤差は、2.4%~3.3%程度ってことが言えますね。
ということは、先週から視聴率が1%~2%上がったとか下がったって議論は、
「それって誤差の範囲内でしょう?」
とも言えますね。
ビッグデータの使い方・活かし方―マーケティングにおける活用事例
- 作者: 朝野 煕彦
- 出版社/メーカー: 東京図書
- 発売日: 2014/01
- メディア: 単行本
本の中に書かれていましたが、首都圏における視聴率のサンプル世帯って600世帯らしい。
意外と少ないと感じたのだが、統計的にはそれくらいの対象者でも大丈夫って判断なのでしょう。
まず、視聴率の誤差を考えます。
視聴率の誤差が一番大きい時は、視聴率が50%の時。
逆に、誤差が0%に近づく、あるいは、100%に近づく時は、誤差が小さくなっていきます。
感覚的には、黒か白か、はっきりしないちょうど50%の確率の時に、サンプル数が一番必要になるってことなんでしょう。
標本誤差の計算方法としては、
標本誤差 = ±√(世帯視聴率(100-世帯視聴率)/標本数)
です。
標本数が600の時、世帯視聴率に対しての標本誤差は、
5%: 1.8%
10%: 2.4%
20%: 3.3%
30%: 3.7%
40%: 4.0%
50%: 4.1%
となります。
視聴率の大半が、10%~20%って考えると、視聴率の誤差は、2.4%~3.3%程度ってことが言えますね。
ということは、先週から視聴率が1%~2%上がったとか下がったって議論は、
「それって誤差の範囲内でしょう?」
とも言えますね。
コメント 0