中古車の検討 その3 見る前にまず問い合わせの方が良さそう [自動車 / バイク]
今回、2日かけて、直接中古車展示場に行ったのですが、ホームページとかで在庫がありってなっていても、実際に行ってみたら、すでに制約済みですって車が多かったです。
たまたま売れてしまったのかもしれませんし、ホームページの更新って頻繁にやっていなかったりするのかもしれません。
なので、まずは、問い合わせをして在庫確認してから行くのが良い気がしました。
たまたま売れてしまったのかもしれませんし、ホームページの更新って頻繁にやっていなかったりするのかもしれません。
なので、まずは、問い合わせをして在庫確認してから行くのが良い気がしました。
[R]線形回帰に非負制約を入れるやり方 [データサイエンス、統計モデル]
線形回帰で、この変数は必ず0以上の値が欲しいという場合があるかもしれません。
基本的には、この様な制約は入れない方が良いです。
というのは、最尤法や最小二乗法で推定する場合、そのパラメータが負である場合が妥当だと推定しているにもかかわらず、無理やりに0以上にしてしまうわけです。
無理に非負制約を入れた結果、どうなるかと言えば、おそらく、推定されたパラメータは0になってしまいます。
(↑)という前提で・・・
通常のlmやglmではなく、lavaanというパッケージを使って、線形回帰に非負制約を入れるやり方について。
lavaanのモデルの書き方(制約なしの場合)
目的変数: y
説明変数: x1, x2
model_1 <- "
y ~ x1 + x2
myLable1 > 0
y ~ 1
"
lavaanのモデルの書き方(制約ありの場合)
目的変数: y
説明変数: x1, x2
制約: x1 > 0
model_1 <- "
y ~ myLable1 * x1 + x2
myLable1 > 0
y ~ 1
"
myLable1 > 0
という条件を加えるとできます。
基本的には、この様な制約は入れない方が良いです。
というのは、最尤法や最小二乗法で推定する場合、そのパラメータが負である場合が妥当だと推定しているにもかかわらず、無理やりに0以上にしてしまうわけです。
無理に非負制約を入れた結果、どうなるかと言えば、おそらく、推定されたパラメータは0になってしまいます。
(↑)という前提で・・・
通常のlmやglmではなく、lavaanというパッケージを使って、線形回帰に非負制約を入れるやり方について。
lavaanのモデルの書き方(制約なしの場合)
目的変数: y
説明変数: x1, x2
model_1 <- "
y ~ x1 + x2
myLable1 > 0
y ~ 1
"
lavaanのモデルの書き方(制約ありの場合)
目的変数: y
説明変数: x1, x2
制約: x1 > 0
model_1 <- "
y ~ myLable1 * x1 + x2
myLable1 > 0
y ~ 1
"
myLable1 > 0
という条件を加えるとできます。
緊急事態宣言の再延長 [時事 / ニュース]
専門家の意見を聞くと、延長した方が良いとのことで首相が延長に踏み切ったとのことでしたが・・・
そりゃ専門家のゴールは、死者数を減らすこと。
死者数を減らすには、永遠に封鎖しておくことがいいわけです。
一方で、医療専門家は、経済のことは一切関係なし。
また、明らかに相関がある自殺者数やうつ病についても関係なし。
ひたすらコロナの死亡者数や感染者数だけを気にしています。
インフルエンザと比較してみると・・・
これまでインフルエンザの死亡者を0にするとか、感染者数を0にするまで経済を封鎖したことがあったか?
→ NO!毎年、数万人の人が死んでいます。なぜコロナだけ0にする必要があるのか?
世界的にみても、コロナの感染者数は激減しています。
ロックダウンしてようがしていまいがほとんど関係ない。
特に、東アジアの人はほとんど影響なし。
そりゃ専門家のゴールは、死者数を減らすこと。
死者数を減らすには、永遠に封鎖しておくことがいいわけです。
一方で、医療専門家は、経済のことは一切関係なし。
また、明らかに相関がある自殺者数やうつ病についても関係なし。
ひたすらコロナの死亡者数や感染者数だけを気にしています。
インフルエンザと比較してみると・・・
これまでインフルエンザの死亡者を0にするとか、感染者数を0にするまで経済を封鎖したことがあったか?
→ NO!毎年、数万人の人が死んでいます。なぜコロナだけ0にする必要があるのか?
世界的にみても、コロナの感染者数は激減しています。
ロックダウンしてようがしていまいがほとんど関係ない。
特に、東アジアの人はほとんど影響なし。
SQL where 1=1 の意味 [データサイエンス、統計モデル]
最近、SQLを書いたり読んだりする機会が増えてきましたが、
といったように、1=1が書かれています。
昔調べたときに、1=1は必ずtrueなので、あってもなくても同じという記事をみて、そんなもんかと思っていました。
気になったので、少し詳しく調べてみると、
動的にプログラミングができるとか、可読性があるとかって記事が多かったのですが、個人的にしっくりきたのは、コメントアウトしやすくなるという理由。
1=1を書いておくだけで、かなり見やすくなります。
SELECT
A
,B
,C
,D
,E
FROM TABLE
WHERE 1=1
and B='This'
and C='That'
and D is not null
といったように、1=1が書かれています。
昔調べたときに、1=1は必ずtrueなので、あってもなくても同じという記事をみて、そんなもんかと思っていました。
気になったので、少し詳しく調べてみると、
動的にプログラミングができるとか、可読性があるとかって記事が多かったのですが、個人的にしっくりきたのは、コメントアウトしやすくなるという理由。
SELECT
A
-- ,B
-- ,C
,D
,E
FROM TABLE
WHERE 1=1
-- and B='This'
-- and C='That'
and D is not null
1=1を書いておくだけで、かなり見やすくなります。
中古車の検討 その4 内装と外装 [自動車 / バイク]
アルファードかヴェルファイアに絞って検索をしていて、何台か見て回りましたが、なかなか良い車に出会えません。
・外装にはものすっごくお金をかけているけど、内装がほぼオプションなし
ファミリーにとっては外装はどうでもよくて、内装の充実が欲しい。
・喫煙車多すぎ問題
禁煙車に絞ると、ものすっごく台数が減ってしまいます。
特に、アルファードかヴェルファイアとかって喫煙している人が多いんじゃないかってくらい車内が臭う。
そして、中古価格が高いんですよね。。。
新車とほぼ変わらないくらい。
例えば、外装が良いなと思って、足りないオプションを追加すると、新車価格と変わらなくなる。
ってことは、値段設定がおかしいわけで、じゃ、別の車を探すかと。
逆に言えば、いろいろなタイプの車があるので、焦って妥協するよりかは、譲れないポイントを明確にして、あとはそれが出てくるのをのんびりと待つってのも良いかなと思いました。
・外装にはものすっごくお金をかけているけど、内装がほぼオプションなし
ファミリーにとっては外装はどうでもよくて、内装の充実が欲しい。
・喫煙車多すぎ問題
禁煙車に絞ると、ものすっごく台数が減ってしまいます。
特に、アルファードかヴェルファイアとかって喫煙している人が多いんじゃないかってくらい車内が臭う。
そして、中古価格が高いんですよね。。。
新車とほぼ変わらないくらい。
例えば、外装が良いなと思って、足りないオプションを追加すると、新車価格と変わらなくなる。
ってことは、値段設定がおかしいわけで、じゃ、別の車を探すかと。
逆に言えば、いろいろなタイプの車があるので、焦って妥協するよりかは、譲れないポイントを明確にして、あとはそれが出てくるのをのんびりと待つってのも良いかなと思いました。
城山から高尾山へ [登山、クライミング]
城山から高尾山へハイキングに行ってきました。
年末年始は膝に水が溜まっていたので、そのことを思ったら、かなり回復してきたかなって思います。
城山に登るのは1時間半くらい。
ここが一番体力を使いました。
そこから高尾山へは1時間くらいですが、ほぼ平坦な山道なので、そんなに疲れない。
高尾山から下山する際には、リフトかロープウェイを使えば膝に負担なく登山できますね。
年末年始は膝に水が溜まっていたので、そのことを思ったら、かなり回復してきたかなって思います。
城山に登るのは1時間半くらい。
ここが一番体力を使いました。
そこから高尾山へは1時間くらいですが、ほぼ平坦な山道なので、そんなに疲れない。
高尾山から下山する際には、リフトかロープウェイを使えば膝に負担なく登山できますね。
城山から高尾山へ その2 やまびこ茶屋 [登山、クライミング]
城山から高尾山へ
https://skellington.blog.ss-blog.jp/2021-03-06
高尾山の山頂からロープウェイの方に進んでいくと、美味しい蕎麦屋があります。
やまびこ茶屋|高尾山山頂 御食事処
http://www.yamabiko-chaya.com/
名物は、とろろそば。
ねばねばしたのが苦手でないなら、こちらがおすすめ。
とろろが苦手だったら、たぬきそばとか、カレーライスもあります。
ロープウェイを降りると、高尾山口駅に直結している温泉がありました。
京王高尾山温泉 / 極楽湯
http://www.takaosan-onsen.jp/
温泉でさっぱりした後は、すぐに電車に乗って都会に帰れます。
以前に比べて、かなり快適になった高尾山登山でした。
https://skellington.blog.ss-blog.jp/2021-03-06
高尾山の山頂からロープウェイの方に進んでいくと、美味しい蕎麦屋があります。
やまびこ茶屋|高尾山山頂 御食事処
http://www.yamabiko-chaya.com/
名物は、とろろそば。
ねばねばしたのが苦手でないなら、こちらがおすすめ。
とろろが苦手だったら、たぬきそばとか、カレーライスもあります。
ロープウェイを降りると、高尾山口駅に直結している温泉がありました。
京王高尾山温泉 / 極楽湯
http://www.takaosan-onsen.jp/
温泉でさっぱりした後は、すぐに電車に乗って都会に帰れます。
以前に比べて、かなり快適になった高尾山登山でした。
メルペイ、Mastercardのバーチャルカードを開始 [マネー]
メルペイ、Mastercardのバーチャルカードを開始
https://jp.merpay.com/news/2021/03/virtualcard/
自社で溜まったポイント価値を上げるにはどうすれば良いか?
基本は、1ポイント1円なわけですが、使える場所が少ないと誰もためたくないです。
楽天とかだと、膨大な楽天市場というポイント経済圏があるので、ほぼなんでも買えますし、最近では、リアル店舗でも楽天ポイントが使えます。
ポンタポイントとリクルートポイントも同じようなもので、なるべく多くの場所で使うことができるって戦略となってきています。
メルカリも当初は、メルカリの購入で使えるポイントからメルペイやdポイントとほぼどこでも使えるようになってきました。
今回、Mastercardのバーチャルカードということで、ネットショッピングであれば、ほぼどこでも使える形となっています。
いかに使える場所を増やしていくか、という視点で各社のポイント戦略を見ていくとなかなか面白いです。
https://jp.merpay.com/news/2021/03/virtualcard/
自社で溜まったポイント価値を上げるにはどうすれば良いか?
基本は、1ポイント1円なわけですが、使える場所が少ないと誰もためたくないです。
楽天とかだと、膨大な楽天市場というポイント経済圏があるので、ほぼなんでも買えますし、最近では、リアル店舗でも楽天ポイントが使えます。
ポンタポイントとリクルートポイントも同じようなもので、なるべく多くの場所で使うことができるって戦略となってきています。
メルカリも当初は、メルカリの購入で使えるポイントからメルペイやdポイントとほぼどこでも使えるようになってきました。
今回、Mastercardのバーチャルカードということで、ネットショッピングであれば、ほぼどこでも使える形となっています。
いかに使える場所を増やしていくか、という視点で各社のポイント戦略を見ていくとなかなか面白いです。
【モンスト】るーみっくわーるどコラボ [ゲーム]
ジャンプとコラボしている気がするのですが、サンデー系のコラボもするんですね。
超究極とかガチャとかないので、ライトな感じのコラボ。
究極とか激究極をクリアして、ビンゴしてって感じで、あっけなく終了しました。
超究極って時々難しすぎて凹む時もありますが、クリアした感はあるので、超究極とかガチャとかあっても良かったのかなって思いました。
超究極とかガチャとかないので、ライトな感じのコラボ。
究極とか激究極をクリアして、ビンゴしてって感じで、あっけなく終了しました。
超究極って時々難しすぎて凹む時もありますが、クリアした感はあるので、超究極とかガチャとかあっても良かったのかなって思いました。
AICを知らない!? [データサイエンス、統計モデル]
統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
RかPythonどっちが良いですか?
【回答】
RとPythonの違いですが、Rは統計モデル向けで、Pythonは機械学習向け。
統計モデルは、ある程度の精度を犠牲にして構造の理解やインサイトの理解をするのに便利。
機械学習は、基本ブラックボックスで、予測精度に重きを置いている。
いずれにしても、実際に使う課題から入った方が理解が進むし、持続すると思います。
話がそれますが、自分的には衝撃の出来事が。
機械学習に関して、ものすごく出来る子がいるのですが、AICを知らなかった。
統計をやっていると、AICはしょっちゅう出てきますが、機械学習メインだとこの辺りって未学習なんですかね。
ただ、とても優秀なので、すぐに理解したのはさすがです。
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
RかPythonどっちが良いですか?
【回答】
RとPythonの違いですが、Rは統計モデル向けで、Pythonは機械学習向け。
統計モデルは、ある程度の精度を犠牲にして構造の理解やインサイトの理解をするのに便利。
機械学習は、基本ブラックボックスで、予測精度に重きを置いている。
いずれにしても、実際に使う課題から入った方が理解が進むし、持続すると思います。
話がそれますが、自分的には衝撃の出来事が。
機械学習に関して、ものすごく出来る子がいるのですが、AICを知らなかった。
統計をやっていると、AICはしょっちゅう出てきますが、機械学習メインだとこの辺りって未学習なんですかね。
ただ、とても優秀なので、すぐに理解したのはさすがです。
3.11から10年 [時事 / ニュース]
3.11から10年ですか。
忘れないようにあの日のことを書いておきたいと思います。
発生した時間は、2011年3月11日14時46分18.1秒。
あの日は41階のオフィスビルにいました。
仕事していたのは、37階とけっこう上の方。
いつものように地震かな?って思ったら、けっこう強い地震が来たのと、揺れている時間が長い!
「あ、これはやばいな・・・」って思って外を見ると、高層ビルの上に設置されているクレーン車がグルグル回っているし、遠くからは火が上がっているし。
いったん皇居の方に避難しましょうってことで、避難したのですが、階段降りるのに30分以上はかかりました。
火災とか起きていたらやばかった。
その後、本日の仕事はおしまいになって家に帰ることにしたのですが、当然、電車などは止まったまま。
歩いて帰りました。
電車だったら30分ですが、歩いたので1時間ちょっとかかりました。
当時は、タワーマンションに住んでいたので、また、30分以上かけて40階まで登りました。
すっごい疲れた。。。
家に帰ると、家族は無事で一安心。
でも、テレビを見ると、原発とか津波とか、一瞬何かの間違いじゃないかってくらいの出来事が写っていました。
その後、大阪の実家に避難したり、また、東京に戻ったりと、バタバタしていたと思いますが、少しずつ忘れてしまってきていますね。。。
ただ、3.11の1日の出来事は、今でも鮮明に覚えています。
過去を忘れるのではなく、これから再び来るであろう大きな災害に何が出来るのか、自分自身で考えていきたいと思います。
忘れないようにあの日のことを書いておきたいと思います。
発生した時間は、2011年3月11日14時46分18.1秒。
あの日は41階のオフィスビルにいました。
仕事していたのは、37階とけっこう上の方。
いつものように地震かな?って思ったら、けっこう強い地震が来たのと、揺れている時間が長い!
「あ、これはやばいな・・・」って思って外を見ると、高層ビルの上に設置されているクレーン車がグルグル回っているし、遠くからは火が上がっているし。
いったん皇居の方に避難しましょうってことで、避難したのですが、階段降りるのに30分以上はかかりました。
火災とか起きていたらやばかった。
その後、本日の仕事はおしまいになって家に帰ることにしたのですが、当然、電車などは止まったまま。
歩いて帰りました。
電車だったら30分ですが、歩いたので1時間ちょっとかかりました。
当時は、タワーマンションに住んでいたので、また、30分以上かけて40階まで登りました。
すっごい疲れた。。。
家に帰ると、家族は無事で一安心。
でも、テレビを見ると、原発とか津波とか、一瞬何かの間違いじゃないかってくらいの出来事が写っていました。
その後、大阪の実家に避難したり、また、東京に戻ったりと、バタバタしていたと思いますが、少しずつ忘れてしまってきていますね。。。
ただ、3.11の1日の出来事は、今でも鮮明に覚えています。
過去を忘れるのではなく、これから再び来るであろう大きな災害に何が出来るのか、自分自身で考えていきたいと思います。
Microsoft surface pro 7がいきなり壊れる [よもやま日記]
先日購入したばかりのsurface pro 7ですが、いきなり壊れました。。。
なんだかハードディスクの異音が聞こえるなと思っていたら、
次は、画面の真ん中に7cmほどのカラフルなラインが縦に表示されてました。
早朝とかにテレビを見るとたまに見えるカラフルな感じのやつです。
なんとなく、ディズプレイの異常っぽい。
さっそくマイクロソフトのサポートに電話をしたら、サポートが混んでいて今日中に電話をしますとのこと。
そして、電話が来ない。
翌日の朝に電話をしたら、やはり、サポートが混んでいて1時間以内に電話をしますとのこと。
そして、2時間くらいたっても電話が来ない。
こちらから催促の電話をしたら、ようやく折り返しの電話が来たのですが、やはりハードの問題らしく交換になりますとのことでした。
もともと、ハードディスクの異音も気になっていたので、交換で良かったのかもしれません。
ここしばらく、macbookとかiphone使っていて、いきなり壊れるなんてことがなかっただけに、ちょっと残念です。
後、サポートの対応も微妙なので、次からはマイクロソフトの製品は買わないことにしました。。。
なんだかハードディスクの異音が聞こえるなと思っていたら、
次は、画面の真ん中に7cmほどのカラフルなラインが縦に表示されてました。
早朝とかにテレビを見るとたまに見えるカラフルな感じのやつです。
なんとなく、ディズプレイの異常っぽい。
さっそくマイクロソフトのサポートに電話をしたら、サポートが混んでいて今日中に電話をしますとのこと。
そして、電話が来ない。
翌日の朝に電話をしたら、やはり、サポートが混んでいて1時間以内に電話をしますとのこと。
そして、2時間くらいたっても電話が来ない。
こちらから催促の電話をしたら、ようやく折り返しの電話が来たのですが、やはりハードの問題らしく交換になりますとのことでした。
もともと、ハードディスクの異音も気になっていたので、交換で良かったのかもしれません。
ここしばらく、macbookとかiphone使っていて、いきなり壊れるなんてことがなかっただけに、ちょっと残念です。
後、サポートの対応も微妙なので、次からはマイクロソフトの製品は買わないことにしました。。。
pythonで回帰分析をやる際の落とし穴 [データサイエンス、統計モデル]
最近、機械学習をずっとやってきた人のレビューをする機会があって、いろいろ衝撃を受けているのですが、よく見かける間違いについて。
機械学習とかだとあまり意識しなくても良いんだろうけど、統計モデルの回帰分析をやる時、説明変数にカテゴリ変数が入っている場合があります。
血液型とか、性別とか。
Rでカテゴリ変数が入っている場合、Rの内部でよしなにダミー変数に変換してくれます。
具体的には、「カテゴリ数-1」となっています。
ずっと、pythonで機械学習をやってきた人はこの辺りのことを知らない人がそれなりにいるみたいでして、そのまま突っ込んで回帰分析をしてしまう。
pythonの場合は、それっぽく動いてしまうのがやっかい。
結果を見て、なんかおかしいんですけど、どうでしてですか?的な質問を何度か受けました。
先日のAICを知らない問題もそうなんですが、統計モデルのかなり初歩的な部分だと思っていただけに、ちょっと驚き。
コードのレビューとかができるエンジニアはたくさんいるけど、肝心のモデル部分のレビューって出来る人って意外と世の中的に少ないのかなって感じる今日この頃です。
機械学習とかだとあまり意識しなくても良いんだろうけど、統計モデルの回帰分析をやる時、説明変数にカテゴリ変数が入っている場合があります。
血液型とか、性別とか。
Rでカテゴリ変数が入っている場合、Rの内部でよしなにダミー変数に変換してくれます。
具体的には、「カテゴリ数-1」となっています。
ずっと、pythonで機械学習をやってきた人はこの辺りのことを知らない人がそれなりにいるみたいでして、そのまま突っ込んで回帰分析をしてしまう。
pythonの場合は、それっぽく動いてしまうのがやっかい。
結果を見て、なんかおかしいんですけど、どうでしてですか?的な質問を何度か受けました。
先日のAICを知らない問題もそうなんですが、統計モデルのかなり初歩的な部分だと思っていただけに、ちょっと驚き。
コードのレビューとかができるエンジニアはたくさんいるけど、肝心のモデル部分のレビューって出来る人って意外と世の中的に少ないのかなって感じる今日この頃です。
中古車の検討 その5 アルファードに決定 [自動車 / バイク]
ようやく中古車が決まりました。
8人乗り、後席テレビ付き、禁煙者のアルファードかヴェルファイアで絞ったのですが、7人乗りだとかなり出てきます。
でも、8人乗りってほとんどなくて、埼玉まで行ってきました。
走行距離も浅くて、車内もけっこうキレイ!
まぁ、新車並みの値段になってくるんですよね。。。
4年落ちにこだわらなければ、新車で買うのが良い気がします。w
8人乗り、後席テレビ付き、禁煙者のアルファードかヴェルファイアで絞ったのですが、7人乗りだとかなり出てきます。
でも、8人乗りってほとんどなくて、埼玉まで行ってきました。
走行距離も浅くて、車内もけっこうキレイ!
まぁ、新車並みの値段になってくるんですよね。。。
4年落ちにこだわらなければ、新車で買うのが良い気がします。w
【モンスト】仮面ライダーコラボ [ゲーム]
昔すぎず、最新すぎない仮面ライダーが登場。
ブラックとか、個人的には、最強の仮面ライダーじゃないかなって思っていますが、究極に登場。
超究極は、オーズらしい。
超究極に備えて、ガチャを引いたら、引きが良すぎて、あっさりと全キャラをゲット!
超究極の様子見て、2体目のガチャ限を狙いますかね。。。
ブラックとか、個人的には、最強の仮面ライダーじゃないかなって思っていますが、究極に登場。
超究極は、オーズらしい。
超究極に備えて、ガチャを引いたら、引きが良すぎて、あっさりと全キャラをゲット!
超究極の様子見て、2体目のガチャ限を狙いますかね。。。
機械学習で大量の変数を作ることの問題点 [データサイエンス、統計モデル]
若手のエンジニアと話していた時の話。
いろんな変数をmaxとかminとか一見意味のない処理で大量に増幅させて、予測精度をあげようという方針でした。
精度ということに着目すれば、こういうアプローチもあるんだろうな、と思うのですが、個人的には大きな違和感があったので、問題点を整理してみます。
(問題点 1)
モデルが2つあった場合、予測精度がA:90%とB:95%である。
B:95%のモデルが良いモデルかといえば、必ずしもそうではない。
クーポンとかポイントの配布をする際に、クーポンの効用部分の精度を確認しないと、大きな失敗をする場合がある。
つまり、介入するという場合、介入する効果の精度が全体の精度より大切。
(問題点 2)
多くの変数をカウントするのではなく、もっと単純な構造が隠れている場合があり、シンプルに少ない変数を加工して使った場合と精度が変わらない。
そして、前者の場合は、作ったモデルは予測にしか使えないが、後者の場合は予測に加えて、構造も同時に理解することができる。
(問題点 3)
大量に変数を使うことで、0.1%精度が上がるかもしれない。
しかし、クーポンをそれなりの人に配るのであれば、0.1%で何が変わるかといえば、ほんの少し順番が変わるくらいだろう。
その辺りのことは無視した方が良い。
(問題点 4)
点で推定した確率しかみない人がいる。
しかし、期待確率は点ではなく、ある幅を持っている。
確率的な幅を出すためには、機械学習モデルより統計モデルの方が良い。
いろんな変数をmaxとかminとか一見意味のない処理で大量に増幅させて、予測精度をあげようという方針でした。
精度ということに着目すれば、こういうアプローチもあるんだろうな、と思うのですが、個人的には大きな違和感があったので、問題点を整理してみます。
(問題点 1)
モデルが2つあった場合、予測精度がA:90%とB:95%である。
B:95%のモデルが良いモデルかといえば、必ずしもそうではない。
クーポンとかポイントの配布をする際に、クーポンの効用部分の精度を確認しないと、大きな失敗をする場合がある。
つまり、介入するという場合、介入する効果の精度が全体の精度より大切。
(問題点 2)
多くの変数をカウントするのではなく、もっと単純な構造が隠れている場合があり、シンプルに少ない変数を加工して使った場合と精度が変わらない。
そして、前者の場合は、作ったモデルは予測にしか使えないが、後者の場合は予測に加えて、構造も同時に理解することができる。
(問題点 3)
大量に変数を使うことで、0.1%精度が上がるかもしれない。
しかし、クーポンをそれなりの人に配るのであれば、0.1%で何が変わるかといえば、ほんの少し順番が変わるくらいだろう。
その辺りのことは無視した方が良い。
(問題点 4)
点で推定した確率しかみない人がいる。
しかし、期待確率は点ではなく、ある幅を持っている。
確率的な幅を出すためには、機械学習モデルより統計モデルの方が良い。