SSブログ

数理計画を実施した後のABテストの注意点 〜その1 コントロールグループ [最適化(数理計画法)]

よく施策が有効かどうかをABテストを実施して確認することが多いです。
単にMLや統計モデルのABテストだとそれほどややこしくはないですが、数理計画を実施すると少しややこしくなるので注意が必要。

例えば、クーポンやポイントを付与するかどうかをMLを使って判断する場合、コントロールグループをどう設計するかです。

まずは、コントロールグループの取扱い。

全データ
┗ CTLグループ(全員、一律)
┗ テストグループ(付与する人と付与しない人がいる)

MLの効果を判断する際に、うっかりやってしまう間違いとして

うっかりする間違い
・CTL(CTLグループ + テストグループのCTL)
・テストグループで付与する人

正しい計測方法
・CTL(CTLグループ)
・テストグループ(テストグループで付与する人 + テストグループのCT)


この様に書くと、当たり前のようにみえるのですが、テストが複雑になってくると、うっかりやってしまうので注意が必要。
・CTL
・テスト1
・テスト2
・テスト3

特に、数理計画などが絡んでくる場合、どう設計するかは複数の視点でレビューしたほうが良いかと思います。

nice!(0)  コメント(0) 
共通テーマ:学問

2021年ボジョレーヌーボー「採れたて苺に齧り付いたような味」 [ビール / ワイン / 日本酒 / 焼酎など]

今日は、ボジョレーヌーボーの解禁日でした。
特に予約していなかった・・・。

毎年、キャッチコピーを楽しみにしていますが、今年は、
「採れたて苺に齧り付いたような味」
らしい。
いちご狩りに行って、採れたてのいちごに齧り付くのは好きです。w

ブドウの味じゃなくてイチゴの味ってのが気になるのですが、試しに1本買ってみようかと思います。

nice!(4)  コメント(0) 
共通テーマ:グルメ・料理

供給が需要を決めるのではなく、需要が供給を決めるのである [マーケティング / 仕事]

自分の先生の言葉。
「供給が需要を決めるのではなく、需要が供給を決めるのである」

さて、バルミューダがスマートフォンを販売!とのこと。

しかし!

機能の割には、めちゃくちゃ高い価格だったり
需要もほとんどないのに何桁も計算できる電卓だったり
ジョブスの真似をしたり
インサイダーしたり・・・

あれ、こんな会社だったっけ?

少し前、トースターを買うときに、
バルミューダにするかアラジンにするか悩んだ時期がありました。
結局、アラジンを買ったんだけど、バルミューダじゃなくて、アラジンにしておいてよかったと心から思った。

そして、今後は、バルミューダの製品を買うことはないだろう。。。

ちなみに、ここ最近、株価は下がっているようです。w

nice!(3)  コメント(0) 
共通テーマ:仕事

【モンスト】シャーマンキングコラボ、ハオ [ゲーム]

新しく始まったS・Fクエスト。
ハオが最終戦(超究極?)。

ただ、あっさりと勝ってしまった・・・。
今回は全体的に簡単なクエストが多かった気がします。
初心者向けなんでしょうか。

ホロホロ(獣神化)
モーセ(大賢者/獣神化)
モーセ(大賢者/獣神化)
レム(獣神化)
あたりで挑戦。

特に実の厳選とか紋章とかしなくても勝ったので、ここ最近の超究極っぽいクエでは楽な方だと思う。

nice!(0)  コメント(0) 
共通テーマ:ゲーム

パナソニックのお掃除ロボットが壊れた、2回目 [よもやま日記]

ルンバではないんだけど、パナソニックのお掃除ロボットが壊れました。

前回(1回目)は、タイヤに髪の毛が絡まったのが原因で壊れた。
今回は、こまめに掃除をしていたんだけど、やはり動かなくなりました。
精密機器だから壊れやすいんですかね。

もちろん、5年保証をつけているので、無償で修理。
冷蔵庫とかテレビってなかなか壊れる感じがしないけど、この手の製品はなるべく長期保証をつけておくべきだなって改めて思った今日この頃です。

nice!(0)  コメント(0) 
共通テーマ:日記・雑感

【階層ベイズモデル】パラメータの収束 [データサイエンス、統計モデル]

通常の線形回帰モデルと階層ベイズモデルの2種類モデルを作って精度を比較すると、通常は階層ベイズモデルの方が精度が良いはずなのに、あまり精度があがらない。

はて?と思い・・・

(1)log-likelihoodのプロットを書いてみる
イテレーション回数を増やすても、激しく向上し続ける。
通常は、10万回くらいMCMCを増やしても爆上がりし続けるので何かおかしい。

(2)Deltaの統計値を書いてみると・・・
なるほど!と。

つまり、こういうこと。
回帰係数の推定値だけど
b1: 0.12
b2: 0.23
b3: 0.34
b4: 560000
みたいな場合、0付近から探索をしたとしても、b4がなかなか収束しない!

というのが原因でした。

そこで、x4の値を適当にスケールすると、無事収束しました。

つまり、
b1: 0.12
b2: 0.23
b3: 0.34
b4: 0.56
みたいになるように事前に調整しておくと良さそうです。

nice!(4)  コメント(0) 
共通テーマ:学問

階層ベイズ線形回帰モデルの対数尤度関数 [データサイエンス、統計モデル]

bayesmとかstanを使ってMCMCをする場合は楽なのですが、自分で尤度関数を作ってメトロポリスヘイスティングなりを作る場合の落とし穴。

正規分布の対数尤度関数を与える必要があるのですが、うっかりミスをしていました。

loglike <- function(y, X, param) {
ll <- sum( ( y - X %*% param )^2 )
}

optimとかに入れて計算する場合は上記で良いのですが・・・
正しくは、sumの前にマイナスが必要で

loglike <- function(y, X, param) {
ll <- -sum( ( y - X %*% param )^2 )
}

としないと値が収束しない。

nice!(3)  コメント(0) 
共通テーマ:学問

階層ベイズモデル、精度か解釈か [データサイエンス、統計モデル]

通常の線形回帰モデルではなく、階層ベイズモデルを使うメリットって何か?
大きく2つあると思います。

(1) 1つ目は、精度が向上すること。
機械学習より精度が向上する場合も多いです。

(2) 2つ目は、よりメカニズムを深く理解できること。

(1)と(2)はトレードオフの関係ですが、階層ベイズモデルをどう定式化するかにも影響を与えます。

例えば、
(model a)
観測モデル y = b1*x1 + b2*x2 + b3*x3 + ε
階層モデル b1 = a0, b1 = a1, b3 = a3
いわゆる階層モデルは切片のみのモデル。

(model b)
観測モデル y = b1*x1 + b2*x2 + ε
階層モデル b1 = a0 + a3*x3
      b2 = a0 + a3*x3
      b3 = a0 + a3*x3
というように x3 を観測モデルはなく、階層モデルに持っきたモデル。

変数を観測モデルか階層モデルかにするかは、さまざまな議論がありますが、
精度に着目すると、(model a)の方が精度が良いと思われます。
基本的は観測モデルの変数量で精度が決まるので。

なので、高い説明力が欲しいのか、ある程度精度を犠牲にしつつ構造の理解をしたいのかでモデリングの方向性が変わってきます。

nice!(0)  コメント(0) 
共通テーマ:学問

カスタマのLTVを予測するためのモデリング [データサイエンス、統計モデル]

カスタマのLTVを予測することは重要なモデリング課題ですが、やってみると意外と難しい。
例えば、ほとんどが0であったり、0より大きくでも分散が大きく、通常のモデリングではあまり使い物にならないケースが多いです。

まだ、実装はできていませんが、この論文が役に立ちそう。
https://arxiv.org/pdf/1912.07753.pdf

nice!(2)  コメント(0) 
共通テーマ:学問

銀座イタリアン ORIGO [グルメ / クッキング]

銀座イタリアン ORIGO
https://ginza-origo.com/

銀座博品館ビル6Fにあるレストラン。
少人数での飲み会(忘年会?)でした。

量は少し少な目でしたが、味は美味しかったです!
カーテンで作られた個室でしたが、落ち着いて食事ができます。

nice!(4)  コメント(0) 
共通テーマ:グルメ・料理

GE、事業別に3社分割へ [時事 / ニュース]

少し前のニュース。
新卒でこの会社に入った時は、まだ、ジャック・ウェルチ氏がトップでした。
その後、何度かCEOが変わり、ついに、分社化なんですね。

20年前、世界最大の企業だったのが、今では、マイクロソフト、appleをはじめとする企業に変わっています。

次の20年はどの企業が出てくるかですが、日本の企業も頑張って欲しいと思います。

nice!(0)  コメント(0) 
共通テーマ:ニュース

水酸化ナトリウムは皮膚を溶かす!? [アニメ / コミック]


Dr.STONE 23 (ジャンプコミックスDIGITAL)

Dr.STONE 23 (ジャンプコミックスDIGITAL)

  • 出版社/メーカー: 集英社
  • 発売日: 2021/11/04
  • メディア: Kindle版



子供に理科(科学)について興味を持たせる良い本ですが、気がついたら、新刊が出ていた。

その中で、理科の問題があって、水酸化ナトリウムは何性かという問題。
正解は、アルカリ性。

ややこしいことに、酸という言葉があるのと、この漫画の中にも、皮膚を溶かすって出ているから、酸性だろう!と思ってしまったらしい。
しかし、水酸化ナトリウムはアルカリ性である。

受験に出るアルカリ性って4つくらいしかなくて、
・水酸化ナトリウム
・アンモニア水
・石灰水
・重曹水
くらいかなと。

nice!(4)  コメント(0) 
共通テーマ:コミック

値上げラッシュ [時事 / ニュース]

ガソリンを入れに行ったけど、相変わらず高いですね。
そして、この傾向は、来年以降も続きそう。

値上げは、ガソリンだけじゃなく、食品や半導体などが値上がりしていくことが決まっています。
でも、利益がでないので、多くの人は給料は上がらない。
物価は上がることは基本的には良いことです。
物価があがり、給料が上がり、そうやって経済が活性化されていく。

今回は、悪い物価あがり。
つまり、不況下なのに物価があがるという「スタグフレーション」が起こっています。

ヨーロッパやアメリカは、このことに早く気がついていたのか、経済100%に振り切っているものの、日本はいまだに、段階的に経済を解除と呑気なこと言っている。
自動車の部品など含めて、先に経済を開放しているヨーロッパやアメリカに行っているため、日本がそろそろ経済を再開させたいと思ったとしても何もできない状況が待っています。

感染症の立場の人からすれば、コロナによる感染者数や重症者数を見ていれば楽なのでしょうが、現実的には厳しい時代がすぐそこに来ていると思います・・・。

nice!(3)  コメント(0) 
共通テーマ:ニュース

生産年齢人口が5年間で226万人減少 [時事 / ニュース]


総務省は30日、2020年国勢調査の確定値を公表した。
経済活動の主な担い手となる生産年齢人口(15~64歳)は7508万7865人となり、
5年前の前回調査から226万6232人減った。


5年間で226万ということは、平均すると年間45.2万人が減少しているということ。
鳥取県の人口が55万人だから、毎年鳥取県の人口が減っているということになります。。。

ちなみに、226万人といえば、
京都府の人口:257万人
宮城県の人口:230万人
新潟県の人口:220万人
くらいなので、これくらいの規模の人口が減ったと。

東京を含む都市部以外に関しては、人口の減少が加速していくので、労働力の減少、税収などの減少などから自治体のサービス自体が成り立たなくなってきている。

いまの高齢者が生きている時代はギリギリ大丈夫かもしれませんが、残された現役世代は本当に厳しい時代になってくると思われます。

オミクロンとか、新しいなんとか株が出てくるたびに、経済に水を差すことをして良いのか。
デルタ株の世界的な広がりを見ていると明らかなように、今後新しいコロナの侵入を防ぐことは不可能です。
オミクロンがすでに各国で感染され始めていますが、デルタ株と同じことが起こると予想できますし、オミクロンの次の変異株も確実に生まれてくる。

世論を恐れて、鎖国を決定した岸田総理ですが、本当に正しい選択だったのか、個人的には疑問です。

nice!(3)  コメント(0) 
共通テーマ:ニュース