SSブログ

階層ベイズで作成したパラメータのシミュレーションについて その2 [階層ベイズ]

里村先生の『マーケティング・モデル』をベースに、階層ベイズのモデルを作り、シミュレーションを行いました。


マーケティング・モデル 第2版 (Rで学ぶデータサイエンス 13)

マーケティング・モデル 第2版 (Rで学ぶデータサイエンス 13)

  • 作者: 里村 卓也
  • 出版社/メーカー: 共立出版
  • 発売日: 2015/04/09
  • メディア: 単行本



階層ベイズで作成したパラメータのシミュレーションについて その1
http://skellington.blog.so-net.ne.jp/2018-05-31

こちらの続き

階層ベイズモデルを予測で使う場合についてです。

1) まず、階層ベイズモデルで予測した人の別の観測データを用いて予測をする場合。
つまり、MCMCで求めたベータを使える場合です。

2) 次に、階層ベイズモデルで用いなかった新しいIDに対して予測をする場合。
こちらは、個人ごとのベータは推定できていません。
なので、Delta(階層部分のパラメータ)から個人ごとのベータを推定する必要があります。

## 1) 階層ベイズモデルで予測した人の別の観測データを用いて予測をする場合
org.beta <- matrix(0,nrow=hh,ncol=nvar)
for (i in 1:hh) {
 org.beta[i,] <- hhdata[[i]]$beta
}
 
z <- cbind(org.beta,beta.mean)
psych::pairs.panels(z, pch=".")
 
## 2) 階層ベイズモデルで用いなかった新しいIDに対して予測をする場合
# 個人のβの平均値を計算(MCMCより)
beta.mean <- matrix(0,nrow=hh,ncol=nvar)
 
for(j in 1:nvar){
 for(i in 1:hh){beta.mean[i,j] <- mean(betadraw[i,j,R0:R1])}
}
 
# 個人のβの平均値を計算2(階層部分より)
beta2.mean <- matrix(0,nrow=hh,ncol=nvar)
Delta2 <- matrix(apply(Deltadraw[R0:R1,],2,mean),nz,nvar)
 
for (i in 1:hh) {
 beta2.mean[i,] <- t(Delta2)%*%Z[i,]+as.vector(t(chol(Vbeta))%*%rnorm(nvar))
}
 
# beta.mean と beta2.mean の散布図
x <- cbind(beta.mean,beta2.mean)
psych::pairs.panels(x, pch=".")


まず、階層部分のパラメータですが、
真の値(実際には不明)
[,1] [,2]
[1,] -2 1
[2,] -1 2

シミュレーションで求めた値
[,1] [,2]
[1,] -2.04 1.00
[2,] -1.03 2.00
ということで、非常に良い当てはまりになっています。

一方で、ベータの値を比較してみると、
1) 階層ベイズモデルで予測した人の別の観測データを用いて予測をする場合

真のベータと強い相関があることが分かります。
つまり、良い予測をすることが分かりました。

2) 階層ベイズモデルで用いなかった新しいIDに対して予測をする場合

相関係数が低いです。
つまり、このままでは、良い予測ができないことが分かりました。

いくつか原因を考えてみると、観測モデルのベータを推定する際に階層モデルのパラメータに誤差を加えるのですが、この分散が大きいことが原因だと思われます。

実際は、全くの未知というわけではなく、未知のIDに対しても、それなりの情報を持っているわけで、この辺りの情報を上手くベイズ的に与えることができれば、良いかと思われますが、この辺りは、自分の限界なので、研究していきたいと思います。

nice!(5)  コメント(0) 
共通テーマ:学問

久々のサンシャイン水族館 [ファミリー]

サンシャイン水族館
http://www.sunshinecity.co.jp/aquarium/

ペリカンとペンギン付近のエリアが改装されていて、オシャレーになっていました。

魚のトンネルというのは、最近、よく見るようになりましたが、
ペリカンやペンギンを上にして、泳いでいる姿を観察できます。

なんだか不思議な気分がしました。





nice!(1)  コメント(0) 
共通テーマ:育児

マザー牧場の体験工房 [ファミリー]

昨日、久々に池袋のサンシャイン水族館に行きましたが、
今日は、久々にマザー牧場に行って来ました。

桃色吐息のイベント
http://www.motherfarm.co.jp/information/petunia2018/



ペチュニアの一種らしいです。
ものすごくキレイでした。

続いて、山の上体験工房に行って「ぴよまる作り」
http://www.motherfarm.co.jp/handmade/detail.php?CN=210434



ボンドで部品を付けるので、乾くまで30分くらい時間がかかりますが、意外と簡単に作れました。

nice!(1)  コメント(0) 
共通テーマ:育児

市原天然温泉江戸遊|源泉かけ流し露天風呂市原の温泉 [温泉・スーパー銭湯]

これまで、色々な温泉(スーパー銭湯)に行って来ましたが、まだ行けていなかった温泉に行って来ました。

市原天然温泉江戸遊|源泉かけ流し露天風呂市原の温泉
http://www.edoyu.com/ichihara/

口コミの評価も良く、入る前から期待度がアップです!

実際に、入ってみると、お風呂の数も多く、かけ流しらしい黒い湯のお風呂がたくさんありました。

温泉の湯といえば、乳白色をイメージする人も多いかと思いますが、
このあたりの温泉の色は、黒っぽい色をしています。

温泉の種類もたくさんあり、日ごろの疲れも取れてすっきりです。
近くに来たときは、また、立ち寄ってみたいです。

nice!(6)  コメント(0) 
共通テーマ:旅行

低出生体重児が増えている日本 [ファミリー]

日本で低出生体重児が増えていると聞きました。
生まれたときの体重による分類では、2500g未満を「低出生体重児」と呼ぶらしいです。

日本の低出生体重児の割合は、1980年に5.2%、1990年に6.3%、2000年に8.6%、2009年に9.6%と増加をたどっている。
近年は、10%で高止まり。

他の先進国で女性の体格向上に伴い出生体重も増えているのに対し、
栄養環境が恵まれているにも関わらず、日本での傾向は特異的となっているようです。

原因としては、
・高齢出産の増加
・20〜30代女性の喫煙率の増加
・やせ志向
などが要因となっています。

上記の原因のいくつかは、個人の努力でなんとかなりそうなものですが、、、
いずれにしても、「低出生体重児」の場合、
・生まれた後、脂肪がつきやすい体になる
・将来、生活習慣病になるリスクがある
・自閉症のリスクがある
ということで、子供にとってメリットはありません。

~参考サイト~
日本で低出生体重児が増えていると聞きましたが本当ですか?
http://www10.showa-u.ac.jp/~dohad/posts/faq.html

小さく産んで大きく育てるは間違い?
https://baby.mikihouse.co.jp/information/post-1212.html

nice!(0)  コメント(0) 
共通テーマ:育児

量子コンピューター [最適化(数理計画法)]

情報処理学会の講演で「量子コンピューター」についての講演会がありました。

以下、簡単なまとめ(備忘録)

量子コンピューターと呼ばれているものは、
・ゲート模式
・量子アニーリング
の二種類。

g

組み合わせ最適化を考えた場合、2nの組み合わせを計算すると膨大な計算量になる。
量子の揺らぎを利用することで、最適解を高速にみつけることができる。
ということで、量子コンピューターが着目されている。

量子アニーリングマシン(D-Wave本体)は数十億円、世界に数台しかない。
クラウド利用だと安価に利用できる。

ゲート方式は現状は小規模の問題しかとけないので、実用化には10年くらいかかる。
しかし、GoogleやAlibabaはそこに1兆円単位の投資(人+金)をかけてきている。

Googleは、ゲート模型と量子アニーリングの両方を持っており、Googleのサービス利用(有料)を視野に入れて開発をしている。
Amazonも同じ路線。

IBMでのカンファレンスでは、実事例はほとんど出てこなかったが、D-Waveのユーザカンファレンスでは、実用されている事例が出てき始めている。

いずれにしても、アメリカ、カナダ、中国、欧州は、量子コンピューティングに莫大な投資をしています。
すぐの実用化は難しいものの、10年くらいのスパンでみれば、何もやっていないリスクは大きい。
(日本は出遅れている・・・)

nice!(0)  コメント(0) 
共通テーマ:学問

おなら漢字ドリル!? [よもやま日記]

日本一楽しい漢字ドリル|うんこ漢字ドリル (公式)
https://unkokanji.com


日本一楽しい漢字ドリル うんこかん字ドリル 小学1年生

日本一楽しい漢字ドリル うんこかん字ドリル 小学1年生

  • 作者: 文響社(編集)
  • 出版社/メーカー: 文響社
  • 発売日: 2017/03/18
  • メディア: 単行本(ソフトカバー)



昨年、文響社から「うんこ漢字ドリル」が出て、ものすごい反響でした。
実際に、本屋でみましたが、例文も面白い。

小学生(特に男子)って、意味もなく「うんこ、うんこ」って言いますよね。
そこに目を付けたのは、さすがだなって思いました。

そして、先日、、、「おなら漢字ドリル」なるものを発見。
Google先生で調べると、リコメンドされるキーワードが
「おなら漢字ドリル パクリ」って推奨されます。w

出版社も違うようです。。。
発売時期を比較すると、「うんこ漢字ドリル」の方が先。
うんこ漢字ドリルが爆売していることを知り、急きょ作った感じがします。

そのせいか、「うんこ漢字ドリル」の例文は、よく考えられた面白い例文ばかりですが、
「おなら漢字ドリル」の例文は、とりあえず作りました感が満載の例文となっていました。

小学生が好きな言葉に、「うんこ、おしっこ、おなら」などなどありますが、
次は、「おしっこ」漢字ドリルとか出てくるんですかね。。。

「うんこ漢字ドリル」は買いたい!と思いましたが、
「おなら漢字ドリル」は買いたい気持ちはゼロです・・・。w

nice!(1)  コメント(0) 
共通テーマ:学問

「0÷0=?」をどう教えるか [ファミリー]

小学校の学校公開(参観みたいなもの)で算数の授業がありました。

そこで、先生が
・○÷○=1  ←同じもので割ったら1
・0÷□=0  ←ゼロで割ったら0
と教えていました。

とある小学生が、「先生、0÷0の答えは?」と聞いていました。

確かに、同じ0で割っているから1かもしれないし、ゼロで割っているなら0。
どっちなんだろう?と疑問がわくのは当然かもしれません。

ちなみに、先生は、「ゼロ!」と即答していました。
まぁ、小学3年生に本気の解説をしても、(ぽか~ん)となるだけですが・・・

【代数学の世界の考え方】
0÷0は、定義していないので、「0÷0=?」という数式は存在しない。
つまり、ゼロで割ることは考えない。

「0で割ってはいけない」ではなく、正確には、「存在しない」が正解。
禁止しているのと、存在しないのは、微妙にニュアンスが違うので注意が必要です。

【解析学の世界の考え方】
sin(x) / x を考える
x->0の時、sin(x) -> 0, x -> 0, lim sin(x) / x -> 1
この場合は、0 ÷ 0 = 1に近づく

次に、sin(x)ではなく、2sin(x)とすると、
x->0の時、2sin(x) -> 0, x -> 0, lim 2sin(x) / x -> 2
この場合は、0 ÷ 0 = 2に近づく

この考え方を拡張していくと、0に近づく速度により、「0÷0=?」の答えはたくさん存在する

【小学生の時に教わった考え方】
自分が小学生の時に教わった考え方が分かりやすいかと。
その先生は、もともと数学をやっていたと思われます。

6÷2=3
6=2×3
というように、割り算の式と掛け算に書き換えることができます。

その1:0÷1=?
0÷1=?
↓掛け算の式に書き換えると
0=1×?
つまり、答えは0です。

その2:0÷0=?
0÷0=?
↓掛け算の式に書き換えると
0=0×?

?に入る数は、なんでもOKです。
0でも良いし、1でも良い。
この様にたくさん答えがあって、一つに定めることができない状態を「不定」と言います。

その3:1÷0=?
1÷0=?
↓掛け算の式に書き換えると
1=0×?

?に入る数は、存在しません。
この様な状態のことを、「不能(不可)」と言います。

nice!(8)  コメント(0) 
共通テーマ:学問

Google Homeの音楽にspotifyを登録 [音楽]

「OK、Google!○○の曲をかけて。」と伝えるには、何らかの音楽配信サービスに登録する必要があります。

Google Play Music、もしくは、Spotifyに登録することになりますが、
今回は、spotifyに登録しました。

ちょうど、「3ヶ月100円で4000万曲聴き放題」キャンペーンやっていたので、SpotifyのPremiumに登録。

4000万曲といっても、邦楽は少なめでした。
「ミスチル」とか「JUDY AND MARY」とか、懐かしい曲も入っており、満足です。

nice!(1)  コメント(0) 
共通テーマ:音楽

「水の科学館」へのアクセス [ファミリー]

久々に水の科学館に行きました。

東京都水の科学館 TOKYO WATER SCIENCE MUSEUM
http://www.mizunokagaku.jp

ちょうど、お台場でイベントやっていたみたいで、周辺の道路がものすっごく混んでいました。
「水の科学館」自体は、空いていました。

つい先日まで、水の科学館の前の道路は、
「月~土(休日を除く)の8時~20時だけ駐車禁止」
となっていました。

日曜日は路駐OKっぽかったのですが、その標識がなくなっており、
駐禁の取り締まりが何度も巡回していました。。。

残念ながら、終日、駐車禁止になってしまったんですかね。。。

nice!(3)  コメント(0) 
共通テーマ:育児

約束の七夜祭り(ななやまつり) [ゲーム]

XFLAGオリジナルアニメ「約束の七夜祭り」公式サイト
https://nanayamatsuri.com




7月7日(土)19時から、YouTubeロードショー!

昨年のクリスマス時期にも、「いたずら魔女と眠らない街」というアニメをYouTubeで流していましたが、かなりのクオリティにもかかわらず、無料配信でした。

流れとして、その映画(アニメ)に出てくるキャラをモンストのガチャで登場させて、課金という想定なのかもしれませんね。

予告を見る限り、なかなか面白そうで期待できます!

ちょうど土曜日から、子供たちと観ようかなぁ。

nice!(7)  コメント(0) 
共通テーマ:ゲーム

ibm think japan 2018 [データサイエンス、統計モデル]

ibm think japan 2018 に行って来ました。
参考になる講演も多々ありましたが・・・。

肝心のIBM Thinkのオフィシャルサイトを見つけららず・・・(苦笑

というのも、当日、受講票をプリントアウトしようとしたら、サイトにたどり着くことができず、相当苦労しました。

後、当日のプログラムの詳細を確認したかったのですが、こちらも確認できず。

けっこう、お金をかけているイベントっぽいのですが、SEO対策がかなり行けておらず、たどり着くページが、公式サイトではなく、スポンサーサイトばかりというとても残念なものでした。

まずは、こういう部分をきちんと対応することが一番重要だと思った今日この頃。。。。

nice!(1)  コメント(0) 
共通テーマ:日記・雑感

階層ベイズの信頼区間を求める [階層ベイズ]

階層ベイズを使ったモデルを作成し、予測を行う際に、
予測値そのものは、普通に計算できます。

一方、統計モデルということで、予測値の信頼区間を出すにはどうすれば良いのか?が疑問でした。

ということで、指導教官の先生に確認したところ、以下の手順で信頼区間を計算するのが分かりやすいとのことでした。

1) MCMCの場合は、尤度が安定する前のステップを除去して使います。
具体的には、仮に、10万回シミュレーションしたとし、最初の8万回を捨てるとします。
残りの2万回を使って信頼区間を計算していきます。

2) 2万回の計算結果には、各イテレーションごとのβが保存されており、
かつ、観測変数 X も分かっています。

各イテレーションの β と x を使い、y を2万個出力する。

すると、2万個の y の分布が出来上がるので、両方の端を捨てた部分が信頼区間になる、とのことでした。

nice!(6)  コメント(0) 
共通テーマ:学問

後部ドアに傷が!連絡する? or しない? [自動車 / バイク]

駐車場に置いていた車ですが、後部ドアに傷がついていました。(涙

原因は隣の車っぽい。
色々なサイトを見たところ、賛否両論あり、意見が割れていました。

連絡する場合、
・マンションの管理組合に連絡する
→ 基本、管理組合は関与しない

・保険会社に連絡する
→ 証明は自分でしなければならない

・警察に連絡する
→ 事故でない場合、取り合わない

ということで、傷つけられた側が証明するには、かなり大変なことが想像できます。

1回くらいだったら、泣き寝入りしたと思いますが、何度も傷つけられており、ここはきちんと処理をした方が良いと思いました。

結論から書くと、きちんと状況を整理し、検証をし、冷静に説明をすることで、相手側にも納得してもらうことができました。

しかし、こういうケースってレアだと思います。
基本的に、否定された場合、それを証明することは極めて難しい。

前部ドアの場合は乗る時に気が付きやすいですが、後部ドアの場合はついつい確認しない場合が多いです。
しかし、乗る前に、ぐるっと車を周回し、傷がついている場合は、素早く行動することが大切だと感じた今日この頃です。

nice!(0)  コメント(0) 
共通テーマ:自動車

AbemaTVトーナメント Inspired by 羽生善治 [将棋]

持ち時間が変則になっています。

フィッシャールール(フィッシャーモード)
持ち時間5分で開始し、1手指すごとに5秒が加算、持ち時間が切れると負け。

なんでフィッシャールールかといえば、ボビー・フィッシャーが考案者だそうです。

ボビー・フィッシャーといえば、チェスの天才。
当時、ボビー・フィッシャーが成田空港で身柄を拘束された際に、羽生さんは当時の小泉首相に
「フィッシャーさんを自由に!」
というお願いをしたそうです。

今回、フィッシャールールが採用になったのも羽生さんらしいといえば、羽生さんらしい気がしました。

nice!(0)  コメント(0) 
共通テーマ:ゲーム

第90期棋聖戦、第2局 羽生竜王が勝利 [将棋]

名人戦と並行で行われている棋聖戦ですが、第2局は、先手の羽生棋聖が81手で勝利しました。
名人戦は7番勝負ですが、棋聖戦は5番勝負と短期決戦。
2連敗すると、後がつらくなります。

今回、羽生竜王が勝利し、1勝1敗となり、改めて3番勝負となりました。

nice!(0)  コメント(0) 
共通テーマ:ゲーム