キング・トリトンのコンサート [Disney / ディズニー]
キング・トリトンのコンサート
http://www.tokyodisneyresort.jp/show/detail/str_id:ml_triton/
こちらもリニューアルされたショーです。
全体として、大きく変わったのが、アリエルが全面的に歌うのと、アースラが登場しなくなったことですかね。。。
アースラがいなくなったのは、個人的にはかなり寂しいのですが、小さい子向けのショーと考えると、アースラ出てきてギャン泣きする子が多数いたので、変更になってしまったんでしょうかね。
http://www.tokyodisneyresort.jp/show/detail/str_id:ml_triton/
こちらもリニューアルされたショーです。
全体として、大きく変わったのが、アリエルが全面的に歌うのと、アースラが登場しなくなったことですかね。。。
アースラがいなくなったのは、個人的にはかなり寂しいのですが、小さい子向けのショーと考えると、アースラ出てきてギャン泣きする子が多数いたので、変更になってしまったんでしょうかね。
GoogleのAIテクノロジーを活用した「AutoDraw」 [よもやま日記]
お絵かきソフトにAIが組み込まれて、簡単に絵が描けるアプリケーションが出ました。
実際に使ってみるには、こちらから。
https://www.autodraw.com/
元々登録されている絵の候補を出して、それに置換する仕様っぽい。
試しに、ミッキーマウスを描きました。
ミッキーは登録されていないのか、ふつ~のネズミとか熊とかが候補に出てきました。
う~ん、可愛くない。。。
実際に使ってみるには、こちらから。
https://www.autodraw.com/
元々登録されている絵の候補を出して、それに置換する仕様っぽい。
試しに、ミッキーマウスを描きました。
ミッキーは登録されていないのか、ふつ~のネズミとか熊とかが候補に出てきました。
う~ん、可愛くない。。。
日清・日露戦争での脚気について [大学院(MBA)]
『統計モデル総論』という授業を受けました。
面白いよもやま話を色々聞けて楽しい授業なのですが、一番、考えさせられたのがこの事例。
当時、海軍では、脚気(かっけ)で死ぬ人が多かったそうです。
脚気は、ビタミンB1の不足が原因で起こる病気なのですが、当時はその原因は良くわかっていませんでした。
いろいろなデータを見ていく中で、白米ではなく、大麦を混ぜてみようということになり、大麦を混ぜることにしました。
当時、軍隊に入ると美味しい白米を食べることができるというのが一つの売りだったのですが、海軍はそれを変更しました。
その結果、脚気による死亡者は0となりました。
一方、陸軍は、ドイツの影響を受け、脚気は、細菌が原因であるという細菌節を信じました。
その結果、陸軍では脚気による死亡者が止まらず、多数の死者が出てしまいました。
日露戦争で亡くなった軍人は1270名。
一方、脚気による死亡者数は、4064名と大幅に多かったようです。
この辺りは、演繹的アプローチと機能的アプローチの違いに通じるのですが、
どちらか一方ということはなく、バランスの良い視点を持っていたいものです。
面白いよもやま話を色々聞けて楽しい授業なのですが、一番、考えさせられたのがこの事例。
当時、海軍では、脚気(かっけ)で死ぬ人が多かったそうです。
脚気は、ビタミンB1の不足が原因で起こる病気なのですが、当時はその原因は良くわかっていませんでした。
いろいろなデータを見ていく中で、白米ではなく、大麦を混ぜてみようということになり、大麦を混ぜることにしました。
当時、軍隊に入ると美味しい白米を食べることができるというのが一つの売りだったのですが、海軍はそれを変更しました。
その結果、脚気による死亡者は0となりました。
一方、陸軍は、ドイツの影響を受け、脚気は、細菌が原因であるという細菌節を信じました。
その結果、陸軍では脚気による死亡者が止まらず、多数の死者が出てしまいました。
日露戦争で亡くなった軍人は1270名。
一方、脚気による死亡者数は、4064名と大幅に多かったようです。
この辺りは、演繹的アプローチと機能的アプローチの違いに通じるのですが、
どちらか一方ということはなく、バランスの良い視点を持っていたいものです。
【ポケモンGO】イースターイベント、ポケモンのタマゴを探せ! [ゲーム]
1週間限定のイベントですが、感覚的に2kmエッグがやたら出るようになった気がします。
2kmから普段は出てこないポケモンが多数出てくるという事でしたが、実際にベビーポケモンがやたら出てきた気がします。
個人的には、エレキッドを持っていなかったのですが、半ばあきらめかけていたところ、今回のイベントであっさりゲット。
2個獲得できました!
2kmから普段は出てこないポケモンが多数出てくるという事でしたが、実際にベビーポケモンがやたら出てきた気がします。
個人的には、エレキッドを持っていなかったのですが、半ばあきらめかけていたところ、今回のイベントであっさりゲット。
2個獲得できました!
SPSS Modeler、シミュレーションノードを用いたモンテカルロ法の話 [データサイエンス、統計モデル]
朝野先生が書かれた『ベイズ統計学』をSPSS Modelerに実装しました。
まずは、マルコフ連鎖モンテカルロ法ではない、普通のモンテカルロ法の話。
6章(6.1 モンテカルロ法より)
店舗A, B, C, Dの売上データあり、それを集計すると
店舗A(平均100, 分散20)
店舗B(平均120, 分散20)
店舗C(平均110, 分散15)
店舗D(平均100, 分散10)
となっていました。
なんとなく店舗Bの平均が高いのですが、1000日間の中で、店舗Bの売上が一番高い日はどれくらいあるでしょうか?といった問題をモンテカルロ法を使って計算します。
実際のストリームは、いたってシンプルです。
「シミュレーション生成」ノードの中身
分布で、正規分布を選んで平均と分散のパラメータを設定
売上なので、マイナスの値が出てくるとおかしいので、最小値を0.0としておきました。
実際は、平均100、分散10~20程度だと0以下になることは極めて稀なのですが、念のためです。w
相関のところは特に設定していませんが、こちらも設定することは可能です。
例えば、週末は売上が高くなるけど、平日は売上が落ちる、みたいな店舗の売上に相関があると仮定するならば、設定しても良いかもしれません。
拡張オプションでは、どれくらいの乱数を発生させるか、つまり、シミュレーションを行うか設定することができます。
デフォルトは10万。
「_max(フィールド作成)」ノードの中身
続いて、どの店舗の売上が最も高いかを計算しています。
それぞれのフィールドで最大だったら1、それ以外は0という設定です。
「レコード集計とソート」ノードの中身
後は、各店舗別に1の数を合計しているだけなので、省略。
結果は、このようになります。
10万レコードあるので、各行のレコード数を10万で割ると、確率が出てきます。
教科書では、Bの店舗が最大になる確率は、54%となっていました。
今回、SPSS Modelerで実装した例では、54.75%ということで、ほぼ同じ結果となりました。
ビジネスマンがはじめて学ぶ ベイズ統計学 ―ExcelからRへステップアップ―
- 作者: 朝野 煕彦
- 出版社/メーカー: 朝倉書店
- 発売日: 2017/02/20
- メディア: 単行本(ソフトカバー)
まずは、マルコフ連鎖モンテカルロ法ではない、普通のモンテカルロ法の話。
6章(6.1 モンテカルロ法より)
店舗A, B, C, Dの売上データあり、それを集計すると
店舗A(平均100, 分散20)
店舗B(平均120, 分散20)
店舗C(平均110, 分散15)
店舗D(平均100, 分散10)
となっていました。
なんとなく店舗Bの平均が高いのですが、1000日間の中で、店舗Bの売上が一番高い日はどれくらいあるでしょうか?といった問題をモンテカルロ法を使って計算します。
実際のストリームは、いたってシンプルです。
「シミュレーション生成」ノードの中身
分布で、正規分布を選んで平均と分散のパラメータを設定
売上なので、マイナスの値が出てくるとおかしいので、最小値を0.0としておきました。
実際は、平均100、分散10~20程度だと0以下になることは極めて稀なのですが、念のためです。w
相関のところは特に設定していませんが、こちらも設定することは可能です。
例えば、週末は売上が高くなるけど、平日は売上が落ちる、みたいな店舗の売上に相関があると仮定するならば、設定しても良いかもしれません。
拡張オプションでは、どれくらいの乱数を発生させるか、つまり、シミュレーションを行うか設定することができます。
デフォルトは10万。
「_max(フィールド作成)」ノードの中身
続いて、どの店舗の売上が最も高いかを計算しています。
@FIELD = max_n([Field_1, Field_2, Field_3, Field_4]
それぞれのフィールドで最大だったら1、それ以外は0という設定です。
「レコード集計とソート」ノードの中身
後は、各店舗別に1の数を合計しているだけなので、省略。
結果は、このようになります。
10万レコードあるので、各行のレコード数を10万で割ると、確率が出てきます。
教科書では、Bの店舗が最大になる確率は、54%となっていました。
今回、SPSS Modelerで実装した例では、54.75%ということで、ほぼ同じ結果となりました。
SPSS Modeler、シミュレーションノードを用いたモンテカルロ法の話 その2 [データサイエンス、統計モデル]
SPSS Modeler、シミュレーションノードを用いたモンテカルロ法の話
http://skellington.blog.so-net.ne.jp/2017-04-21
↑
前回は、正規分布を使ったシミュレーションでした。
今回は、ベータ分布を使ったシミュレーションの例になります。
ベータ分布は、ベルヌーイ分布や二項分布の事前分としての相性がとても良い分布です。
共役分布(きょうやくぶんぷ)と読みます。
3月の視聴率を30%と「点」で与えるのではなく、「30%付近に分布している」と分布で考えます。
シミュレーションノードを設定するとイメージが湧くかと思います。
例えば、形状1と2を1/10倍(サンプルサイズが1/10倍)にすると、分布は広がってきます。
つまり、30%よりも離れた値を取る割合が増えます。
形状の計算は、60人の30%ということで、18人、60人-18人=42人と計算します。
18+1=19
42+1=43
一方、形状1と2を10倍(サンプルサイズが10倍)にすると、分布の幅は狭くなります。
形状の計算は、6000人の30%ということで、1800人、6000人-1800人=4200人と計算します。
1800+1=1801
4200+1=4201
後は、「 theta_3 > theta_2 and theta_2 > theta_1 」となる確率を計算すれば、OKです。
朝野先生の教科書では、10万回シミュレーションされいて、0.57213という値でした。
SPSS Modelerを使ったシミュレーションでは、0.57299となり、非常に近い値を得ることができました。
http://skellington.blog.so-net.ne.jp/2017-04-21
↑
前回は、正規分布を使ったシミュレーションでした。
今回は、ベータ分布を使ったシミュレーションの例になります。
ベータ分布は、ベルヌーイ分布や二項分布の事前分としての相性がとても良い分布です。
共役分布(きょうやくぶんぷ)と読みます。
3月の視聴率を30%と「点」で与えるのではなく、「30%付近に分布している」と分布で考えます。
シミュレーションノードを設定するとイメージが湧くかと思います。
例えば、形状1と2を1/10倍(サンプルサイズが1/10倍)にすると、分布は広がってきます。
つまり、30%よりも離れた値を取る割合が増えます。
形状の計算は、60人の30%ということで、18人、60人-18人=42人と計算します。
18+1=19
42+1=43
一方、形状1と2を10倍(サンプルサイズが10倍)にすると、分布の幅は狭くなります。
形状の計算は、6000人の30%ということで、1800人、6000人-1800人=4200人と計算します。
1800+1=1801
4200+1=4201
後は、「 theta_3 > theta_2 and theta_2 > theta_1 」となる確率を計算すれば、OKです。
朝野先生の教科書では、10万回シミュレーションされいて、0.57213という値でした。
SPSS Modelerを使ったシミュレーションでは、0.57299となり、非常に近い値を得ることができました。
富士山こどもの国 開園18周年 「街」~「水の国」 [ファミリー]
4月23日(日)は、開園18周年ということで入場料が無料の日でした。
まずは、「街」の広場でちょっと変わった自転車に乗りました。
15分200円です。
「水の国」に移動して、お砂場遊び。
割と広い砂場で、人も少ないです。
スコップとかバケツはもともと置いてありました。
同じく「水の国」でニジマス釣り。
釣り道具を400円でレンタルして、1匹まで無料
二匹目からは300円で塩焼きが食べれます。
かなり美味しいですね。
まずは、「街」の広場でちょっと変わった自転車に乗りました。
15分200円です。
「水の国」に移動して、お砂場遊び。
割と広い砂場で、人も少ないです。
スコップとかバケツはもともと置いてありました。
同じく「水の国」でニジマス釣り。
釣り道具を400円でレンタルして、1匹まで無料
二匹目からは300円で塩焼きが食べれます。
かなり美味しいですね。
富士山こどもの国 開園18周年 「草原の国」 [ファミリー]
「草原の国」に移動して、溶岩谷の遊び場で遊びました。
ゴツゴツした岩が多くて、歩くのが大変。
くもの巣ネットは、大きいクモの巣と小さいクモの巣がありました。
残念ながら、大人は遊べません。。。
わんぱくの森アスレチック
「ターザンロープ」「モンキーブリッジ」、「丸太渡り」「丸太登り」といったアスレチックがあります。
「草原の国まきば」でアルパカとのふれあいができます。
羊みたいなラクダみたいなアルパカですが、鳴き方は「メェ~」ではなく、「フ~ン」に近く、なんとも気の抜けた声を出していました。w
ゴツゴツした岩が多くて、歩くのが大変。
くもの巣ネットは、大きいクモの巣と小さいクモの巣がありました。
残念ながら、大人は遊べません。。。
わんぱくの森アスレチック
「ターザンロープ」「モンキーブリッジ」、「丸太渡り」「丸太登り」といったアスレチックがあります。
「草原の国まきば」でアルパカとのふれあいができます。
羊みたいなラクダみたいなアルパカですが、鳴き方は「メェ~」ではなく、「フ~ン」に近く、なんとも気の抜けた声を出していました。w
将棋、藤井聡太四段が羽生三冠に勝利 [将棋]
AbemaTVのイベントで、非公式戦ですが、中学生棋士の藤井聡太四段が羽生三冠と対戦し勝利しました。
他の棋士とも対戦をしており、6勝1敗ということで、大きく勝ち越しました。
すごい棋士が現れたものです。
とはいえ、羽生さんにはまだまだ活躍して欲しいところ。
いずれタイトル戦で公式に戦う日も来るでしょうが、その対局が楽しみです。
他の棋士とも対戦をしており、6勝1敗ということで、大きく勝ち越しました。
すごい棋士が現れたものです。
とはいえ、羽生さんにはまだまだ活躍して欲しいところ。
いずれタイトル戦で公式に戦う日も来るでしょうが、その対局が楽しみです。
ビックデータって何が嬉しいか? [大学院(MBA)]
4月から、新しい授業が始まりましたが、「なるほど!」と思える事も多く、備忘録として残しておきます。
【フランシス・ゴルトン】
統計学の父と言われている人。
有名なのは回帰分析とか相関係数とかの研究でしょうか。
ただ、ちょっと危ない思想の持ち主だったみたいで、人の才能は、遺伝するという思想でした。
さらに、人間も動物と同じく人為選択を適用することで、良い社会が出来ると主張しました。。。
【フィッシュボーン】
マーケティングで良く出てくる、特性要因図(fishbone diagram)ですが、アメリカでは小学校3年くらいでこれを習うらしい!
ちなみに、これは石川 馨(いしかわ かおる)先生が草案しました。
【データ分析をするコスト】
今は、ほとんど0に近い。
人を育てるという経費も安くなってきて、教育のスピードも高速化している。
そこで、価格破壊が起こっており、データ解析のコンサルティング会社が増えている。
【ビックデータって何が嬉しいか?】
データが多くなると精度が良くなるか?
データが100倍になっても、誤差は1/10倍にしかならない。
平均値を予測するなら、それほど大きなデータは必要ない
ビックデータの利点、分布の極値は画期的に良くなる。
つまり、データ多くなることで、分布の裾(端っこ)についての議論が出来るようになる。
これは、問題を分けて考える必要がある。
そして、おかしなことが起きている時に、すぐにアラートが出せるかが問題で、何がおかしいかを理解することで、新しい発見がそこに眠っている。
平均値ではなく、上位になりやすい要因を予測する
↑
裾の情報
昔は、データはデザインをして取っていた。
ゴミからはゴミしか出てこない(昔の話)
+ー(直交表)を使って、少ない回数で多くの実験を行うことができる
コマツのトラクタ(32台)を使って実験を行った
技術開発速度に貢献した
データの数を大きくするのではなく、実験を大切に行うことが重要!
【フランシス・ゴルトン】
統計学の父と言われている人。
有名なのは回帰分析とか相関係数とかの研究でしょうか。
ただ、ちょっと危ない思想の持ち主だったみたいで、人の才能は、遺伝するという思想でした。
さらに、人間も動物と同じく人為選択を適用することで、良い社会が出来ると主張しました。。。
【フィッシュボーン】
マーケティングで良く出てくる、特性要因図(fishbone diagram)ですが、アメリカでは小学校3年くらいでこれを習うらしい!
ちなみに、これは石川 馨(いしかわ かおる)先生が草案しました。
【データ分析をするコスト】
今は、ほとんど0に近い。
人を育てるという経費も安くなってきて、教育のスピードも高速化している。
そこで、価格破壊が起こっており、データ解析のコンサルティング会社が増えている。
【ビックデータって何が嬉しいか?】
データが多くなると精度が良くなるか?
データが100倍になっても、誤差は1/10倍にしかならない。
平均値を予測するなら、それほど大きなデータは必要ない
ビックデータの利点、分布の極値は画期的に良くなる。
つまり、データ多くなることで、分布の裾(端っこ)についての議論が出来るようになる。
これは、問題を分けて考える必要がある。
そして、おかしなことが起きている時に、すぐにアラートが出せるかが問題で、何がおかしいかを理解することで、新しい発見がそこに眠っている。
平均値ではなく、上位になりやすい要因を予測する
↑
裾の情報
昔は、データはデザインをして取っていた。
ゴミからはゴミしか出てこない(昔の話)
+ー(直交表)を使って、少ない回数で多くの実験を行うことができる
コマツのトラクタ(32台)を使って実験を行った
技術開発速度に貢献した
データの数を大きくするのではなく、実験を大切に行うことが重要!
ビックデータの落とし穴 [階層ベイズ]
4月から、新しい授業が始まりましたが、「なるほど!」と思える事も多く、備忘録として残しておきます。
【ビックデータの落とし穴】
「データの動的構造と多変量因果構造の同時モデル」が難しい。
偶然の相関の問題。
1万検定を行うと100個くらい1%有意になるものが発生する。
統計的有意性症候群になってはダメ。
構造が不均一(質の悪いデータ)
階層ベイズ、潜在クラスを使うことで色々なことが分かってくる。
SVMやNNは、ブラックボックス?
回帰構造不均一性をデータから学習するから精度が良い。
一方、階層ベイズは、この人にはこの人には効くが、別の人には説明変数が効くということを表現することができる。
樹形モデル(決定木)は、ニューラルネットワークに比べたら精度は悪いが、人間にとって非常に理解しやすい。
【AI(機械学習)と統計モデルの棲み分け】
機械学習(AI):目的に対する最適化をスピーディーに作ることが出来る。
ただ、色々なところで、おかしなことが起こっていることを認識すること。
統計モデル:人の知識を利用する。
構造を表現、モデリングすることで、マーケティング施策に役立つ。
ベストパフォーマンスだけでなく、ワーストパフォーマンスも理解して使うこと。
【研究について重要な事】
1.目的
個性・着想
2. 手段
技術力・創造力
3. 評価
実験の計画
【ビックデータの落とし穴】
「データの動的構造と多変量因果構造の同時モデル」が難しい。
偶然の相関の問題。
1万検定を行うと100個くらい1%有意になるものが発生する。
統計的有意性症候群になってはダメ。
構造が不均一(質の悪いデータ)
階層ベイズ、潜在クラスを使うことで色々なことが分かってくる。
SVMやNNは、ブラックボックス?
回帰構造不均一性をデータから学習するから精度が良い。
一方、階層ベイズは、この人にはこの人には効くが、別の人には説明変数が効くということを表現することができる。
樹形モデル(決定木)は、ニューラルネットワークに比べたら精度は悪いが、人間にとって非常に理解しやすい。
【AI(機械学習)と統計モデルの棲み分け】
機械学習(AI):目的に対する最適化をスピーディーに作ることが出来る。
ただ、色々なところで、おかしなことが起こっていることを認識すること。
統計モデル:人の知識を利用する。
構造を表現、モデリングすることで、マーケティング施策に役立つ。
ベストパフォーマンスだけでなく、ワーストパフォーマンスも理解して使うこと。
【研究について重要な事】
1.目的
個性・着想
2. 手段
技術力・創造力
3. 評価
実験の計画
IBM Watson Summit 2017 [データサイエンス、統計モデル]
IBM Watson Summit 2017 に参加してきました。
実際に、自分でWatsonを呼び出すハンズオンセッションがあったりと、なかなか良かったです。
自分は、機械学習よりも統計モデル/ビジネス側の人間なので、そのあたりのセッションが減ってきているのは残念ではありますが、どちらか一方というよりかは使い分けな気がします。
片一方だけ知っていてはダメで、時間はかかるものの両方それなりに深いレベルまで理解しておくことが重要だと思っていましたし、今回のセッションを受けてやはりそうだなって思いました。
実際に、自分でWatsonを呼び出すハンズオンセッションがあったりと、なかなか良かったです。
自分は、機械学習よりも統計モデル/ビジネス側の人間なので、そのあたりのセッションが減ってきているのは残念ではありますが、どちらか一方というよりかは使い分けな気がします。
片一方だけ知っていてはダメで、時間はかかるものの両方それなりに深いレベルまで理解しておくことが重要だと思っていましたし、今回のセッションを受けてやはりそうだなって思いました。
回し寿司 活 池袋西武店 [グルメ / クッキング]
安くて美味しい回転寿司なら回し寿司 活美登利(SUSHI KATSUMIDORI)
http://katumidori.co.jp/
食べログの評価が、3.5ある回転寿司屋さんです。
娘の筆を取に行った帰りに寄りました。
池袋西武百貨店の8階にあります。
同じ階に別のお寿司屋さんもあるので注意が必要です。。。
実際に行ってみると、かなりの行列でした。
30分くらい待ちましたが、実際食べてみると、行列が出来るのもうなずけます。
他の回転寿司に比べて、かなり美味しいし、それでいて、値段も安い。
残念なのが、家の近くにこのお店がないことです。。。
23区内には、いくつかチェーン店があるみたいなので、近くに行ったときは、また、寄ってみたいです。
http://katumidori.co.jp/
食べログの評価が、3.5ある回転寿司屋さんです。
娘の筆を取に行った帰りに寄りました。
池袋西武百貨店の8階にあります。
同じ階に別のお寿司屋さんもあるので注意が必要です。。。
実際に行ってみると、かなりの行列でした。
30分くらい待ちましたが、実際食べてみると、行列が出来るのもうなずけます。
他の回転寿司に比べて、かなり美味しいし、それでいて、値段も安い。
残念なのが、家の近くにこのお店がないことです。。。
23区内には、いくつかチェーン店があるみたいなので、近くに行ったときは、また、寄ってみたいです。
ドラゴンクエスト モンスターバトルスキャナー [ゲーム]
ゲームセンターにあるカードゲームですが、息子は仮面ライダーとかガンダムが大好き。
池袋に行ったときに探したのですが、ゲームセンターは多いものの、意外と仮面ライダーやガンダムなく、ドラクエのカードゲームしかなかったです。
仕方なしに、やってみたら、意外と面白い。w
ドラゴンクエスト モンスターバトルスキャナー
http://www.dragonquest.jp/dqmbs/
1回100円でカードがもらえるのですが、たまにレアポケモンとか出て、さらに1枚欲しい場合は、追加で100円かかります。
そして、Sサイズ、Mサイズ、Lサイズと強くなっていくのですが、
Mサイズの場合は、最初からプラス100円かかりました。。。
Lサイズの場合は、どうなんでしょう。。。(^^;
池袋に行ったときに探したのですが、ゲームセンターは多いものの、意外と仮面ライダーやガンダムなく、ドラクエのカードゲームしかなかったです。
仕方なしに、やってみたら、意外と面白い。w
ドラゴンクエスト モンスターバトルスキャナー
http://www.dragonquest.jp/dqmbs/
1回100円でカードがもらえるのですが、たまにレアポケモンとか出て、さらに1枚欲しい場合は、追加で100円かかります。
そして、Sサイズ、Mサイズ、Lサイズと強くなっていくのですが、
Mサイズの場合は、最初からプラス100円かかりました。。。
Lサイズの場合は、どうなんでしょう。。。(^^;