SSブログ

【Zoom】クラウドビデオ会議サービス [よもやま日記]

AIジョブカレ
https://www.aijobcolle.com/

こちらで統計を教えていますが、新型コロナウィルスの影響で授業がzoomになっています。

実際に使っていていろいろ便利なので、個人でも使ってみようと思い調べてみたら、
ac.jp, ed.jp メールドメインを持っていると、時間制限なしで利用開放されているっぽいです。

4/30まで無料で使えるとのことで、さっそく使てみたいと思います。

【Zoom】遠隔授業向け クラウドビデオ会議サービス「Zoom」 ■学校への提供 ■無料(2020年4月30日まで) | 未来の教室 ~learning innovation~
https://www.learning-innovation.go.jp/covid_19/zoom/

nice!(3)  コメント(0) 
共通テーマ:動画

RStudio Cloudを使ってipadでRを動かす その2 [データサイエンス、統計モデル]

RStudio Cloudを使ってipadでRを動かす
https://skellington.blog.ss-blog.jp/2020-03-17

こちらの続き。

実際にローカルのデータをRStudio Cloudにアプロードして実行しました。
セキュリティが気になるところなので、普段、講師をしていて使っている講義用のデモデータをアップロードします。

データサイズはそれほど大きくないので、アプロードもスムーズにできました。

> getwd()
[1] "/cloud/project"

という場所にプロジェクトが作成されるようです。
このproject配下にdataフォルダなどを作り分析することができました。

さすがにstanを使ったベイズモデルなどは、エラーが帰って来ました。
それほど計算量がかかるモデルではないのですが、このあたりは無料なので限界なんでしょう。

stanなど負荷がかかるモデルの場合、ローカルのPCで実行し、それをcloud上にアップロードすることもできます。
アプロードした後は、R studio cloudからロードすれば、実行結果などcloud上で表示させることができました。

ちなみに、パッケージのインストールするなども普通のローカルで使っている感覚で行うこともできました。

nice!(0)  コメント(0) 
共通テーマ:学問

新型コロナウイルス、東京都内の感染4割が30代以下 [時事 / ニュース]

コップの中の水が半分無くなった時に
「コップの水が半分もなくなった」と書くか
「コップの水が半分しか減っていない」と書くかで
印象が大きく異なっています。

「新型コロナウイルス、東京都内の感染4割が30代以下」という表記は、あたかも若者が感染源で高齢者に感染させている!というイメージになってしまいます。
「新型コロナウイルス、東京都内の感染6割が40代以上」とした方が高齢者が不要不急に外出しなくても良いのでは?

きちんとしたデータが出て来ていませんが、おそらく、若い人も高齢者も、年齢に関係なく、コロナにかかると思います。
ただ、重篤化するのは高齢者の方。
なので、厳格に自宅待機した方が良いのも高齢者。

渋谷や原宿など、若者が集まる場所のイベントは劇的に減っているイメージですが、巣鴨など高齢者が集まる場所のイベントは減っていないイメージです。
縁日などのイベントも普通に開催されているみたいだし。

また、コロナによる直接的な死とは別に、経済が止まることによる間接的な死という方がはるかに影響が大きい。
バブルが弾けた時やリーマンショック後に自殺する必要が増えましたが、数十万人単位でした。

こう考えると、ある程度経済も回していきつつ、コロナによる感染者数も抑えていかないと行けない。

幸福度が高い国でよく出てくるスウェーデンなどは、高齢者を隔離しつつ、若者の移動を制限するという政策をしているようです。

「若者が〜!」と叫ぶより、高齢者の自粛をもう少し強く言った方が良いのでは?と感じる今日この頃です。

nice!(1)  コメント(0) 
共通テーマ:ニュース

なぎさ公園と富士公園 [ファミリー]

今週の土日はいろいろなところがお休み。
近所のモールも食品売り場は空いてますが、フードコートなどの店は閉まっていました。

よく遊びに行くなぎさ公園と富士公園は、桜が咲いていて、天気も良く気持ちよかったです。
ポニーは感染予防の観点から乗れませんでしたが、久々に体を動かすことができました。

ずっと室内だと体も鈍って良くないですよね。。。

nice!(3)  コメント(0) 
共通テーマ:育児

IBM Think Digital Event Experience [データサイエンス、統計モデル]

IBM Think Digital Event Experience
https://www.ibm.com/events/think/

今年は、ゴールデンウィークに開催ってことでもともと参加するつもりはなかったのですが、
コロナウィルスの影響でビデオカンファレンスに変わったようです。

しかも、いつもなら参加チケットが数十万と、かなりのお値段ですが、ビデオカンファレンスということで無料。
ちょうどゴールデンウィーク中なので、自宅からのんびり参加したいと思います。

登録は数分でできました。

nice!(0)  コメント(0) 
共通テーマ:学問

Chromecast と amazon video, youtubeと接続する [よもやま日記]

家を掃除していたら数年前に買ったChromecastを発見しました。
前回買った時は何ができるかわからないまま、そのまま倉庫入りとなっていました。

調べてみると、amazon videoに繋いだり、youtubeにつないだりできます。

普段は、iPadなどでみるか、iPadとテレビを接続してみているのですが、いちいち接続するのが面倒。
ChromecastをTVにつなげていると、iPadからChromecastを通じて、TVでみれると、ちょっとだけ便利になりました。


Google Chromecast 第三世代 2K対応 GA00439-JP

Google Chromecast 第三世代 2K対応 GA00439-JP

  • 出版社/メーカー: Google
  • 発売日: 2020/03/01
  • メディア: エレクトロニクス



nice!(1)  コメント(0) 
共通テーマ:パソコン・インターネット

『映画 すみっコぐらし とびだす絵本とひみつのコ』 [テレビ / 映画]

『映画 すみっコぐらし とびだす絵本とひみつのコ』公式サイト
http://sumikkogurashi-movie.com/

この映画観たかったけど、映画館で見に行く時間がなかったので、DVDを買うことにしたら・・・
なんとamazon primeでやっていました。
(ラッキー!)






すみっコぐらし検定公式ガイドブック すみっコぐらし大図鑑 (生活シリーズ)

すみっコぐらし検定公式ガイドブック すみっコぐらし大図鑑 (生活シリーズ)

  • 出版社/メーカー: 主婦と生活社
  • 発売日: 2018/07/31
  • メディア: ムック



ということで、期待に胸を躍らせながらみてみると。

序盤は、ちょっと失敗したかな・・・と思いました。
しかし、後半、話が急展開。

最後は、あ〜なるほど、と良い終わり方でした。
細かい描写にちょっとした意味があり、うるっとくる場面も。

良い映画かなって思います。

nice!(3)  コメント(0) 
共通テーマ:映画

【ベイズモデリング】中古車価格をstanを使ってモデリング [データサイエンス、統計モデル]

中古車データをサイトから取得してどのような要因になっているかモデルを作りました。
簡単に作るなら、線形回帰モデルとなります。

データの例
Price(目的変数):中古車価格
Yr(説明変数):経過年数
KM(説明変数):走行距離
その他の説明変数

lm.out <- lm(Price~., data=dat)
summary(lm.out)

この時、Yrは想定通りの符号となりましたが、KMは想定とは逆に符号となりました。
つまり、普通は、走行距離が増えると中古車価格は落ちるのですが、線形回帰の結果だと、走行距離が増えると中古車価格が高くなるという結果になってしまいます。

符号が逆転する理由はすぐに分かったのですが、ベイズモデルを使えば、想定通りの結果になるのでは?という疑問があり、ベイズモデルで中古車価格を予測しました。
使ったツールは、R stanです。

結果は、stanの結果もlm(線形回帰)の結果もほぼ同じでした。
扱っているデータが一点尤度なので、得られる結果もほぼ同じ…なのかもしれません。


### Rのコード ###
library("rstan")

# データの準備
dat <- read.table("./data/SecondhandCar.csv", header=T, sep=",")
dat_mcmc <- list(N=nrow(dat), P=dat$P, TM=dat$TM, Yr=dat$Yr
                            , CT=dat$CT, NP=dat$NP, DEAL=dat$DEAL, KM=dat$KM)

## MCMCの実行 1
mcmc_out <- stan(file="SecondhandCar.stan", data=dat_mcmc, seed=1234)

### stanのコード ###
// SecondhandCar

data{
  int N;
  int P[N];
  int TM[N];
  int Yr[N];
  int CT[N];
  int NP[N];
  int DEAL[N];
  real KM[N];
}

parameters{
  real b0;
  real b1;
  real b2;
  real b3;
  real b4;
  real b5;
  real b6;
  real sigma;
}

transformed parameters{
  real reg_mean_P[N];
  for(n in 1:N){
    reg_mean_P[n] = b0 + b1*TM[n] + b2*Yr[n] + b3*CT[n] + b4*NP[n] + b5*DEAL[n] + b6*KM[n];
    }
}

model{
  for(n in 1:N){
    P[n] ~ normal(reg_mean_P[n], sigma);
  }
  // Leave out prior distribution. Uninformative prior will be used.
}


nice!(3)  コメント(0) 
共通テーマ:学問

マシュマロ実験 [データサイエンス、統計モデル]

マシュマロ実験
https://ja.wikipedia.org/wiki/%E3%83%9E%E3%82%B7%E3%83%A5%E3%83%9E%E3%83%AD%E5%AE%9F%E9%A8%93

Stanford marshmallow experiment
https://en.wikipedia.org/wiki/Stanford_marshmallow_experiment

マシュマロテストとは、子供とマシュマロを部屋に残しておき、一人になっても食べたらダメと伝える。
親が戻ってくるまで食べなかったら、マシュマロを2個あげると答えて、自制心があるかどうかをテストする実験です。

その後、子供の追跡調査をしており、初回のマシュマロテストでは、マシュマロを食べなかった子供の方(自制心がある子)が、社会的な成功度が高いという結果になった。
この辺りは、子供の遺伝的な要因が、将来の社会的な成功度と因果があると考えられていた・・・

しかし!
その後の、再調査で結論が変わります。

家庭の経済的背景という因子を考えると、実は、子供の自制心(遺伝的な要因)と社会的な成功度は関連がなく、
経済的背景と社会的な成功度が高かった!ということがわかりました。

その後、色々な実験でわかってきたことは、遺伝的な要因は10%ちょっと程度で、家庭の経済的背景が子供の将来の成長を決めるという結果がわかってきています。
それでも、遺伝的な要因が10%ちょっとあるという事実を大きいと見るとか、小さいと見るかですが。。。


成功する子 失敗する子――何が「その後の人生」を決めるのか

成功する子 失敗する子――何が「その後の人生」を決めるのか

  • 出版社/メーカー: 英治出版
  • 発売日: 2013/12/19
  • メディア: ハードカバー



こちらの本はとても参考になります。
kindle版の方がちょっと安いですね。

nice!(1)  コメント(0) 
共通テーマ:学問

マシュマロ実験と新型コロナ死者の関係 [データサイエンス、統計モデル]

マシュマロ実験と新型コロナ死者の関係

マシュマロ実験
https://skellington.blog.ss-blog.jp/2020-04-09

こちらの続き。

マシュマロテストを共分散分析の枠組みで考えて見ます。

結果 y ← 要因 x(x = 0, 1)
y と x の共変量として、家庭の環境(親の年収)v
とすると

y = β0 + β1 * x + β2 * v + ε, ε~N(0, σ2)
という統計モデルになっています。

このように共分散分析(重回帰モデル)を作ると、vという共変量を統制した(vが同じとした)時の要因xの効果を分析することができます。

マシュマロ実験の例では、家庭の環境という要因を統制した(共変量v)時に、マシュマロを食べるかどうか(要因x)が将来社会的な成功度合(y)にどのような影響があるかを分析できます。

最近、コロナウィルスの報道を見ていると、
・新型コロナ死者、なぜ黒人が多いのか
・新型コロナ死者、なぜ男性が多いのか
という記事をよく見ます。

遺伝的に黒人とか、男性がコロナウィルスになると重篤化し、死亡率が高いのか?
おそらく、答えは、NO。
背後にある共変量として、
・新型コロナ死者、なぜ黒人が多いのか
 →貧困率が高い
・新型コロナ死者、なぜ男性が多いのか
 →タバコを吸っている人が男性に多い
が考えられます。

ロサンゼルスの街を見て見ると、白人は車を使って移動し、黒人はバスや電車といった公共機関を使って移動する人が多かったです。
また、マクドナルドなどの人と接する機会が多いところで働いている人も黒人の率が高いです。

nice!(3)  コメント(0) 
共通テーマ:学問

Rakuten UN-LIMITでdocomo simフリー版を設定する [よもやま日記]

楽天モバイルのSIMが家に届きました。
もともとdocomoを使っていますが、使わなくなったスマートフォンをSIMフリー化して使用。

楽天モバイル対応機種という、楽天から販売している機種以外を使う場合は、自分でAPNの設定をする必要があるみたいです。

<APN手動設定>
名前:rakuten.jp(任意)
APN:rakuten.jp
APNプロトコル:IPv4/IPv6
APNローミングプロトコル:IPv4/IPv6

それほど難しい設定でないと思います。

後は、my楽天モバイルと、楽天linkのアプリをインストールして、設定に従ってOKしていけば、設定完了。

エリア内だと、データ通信無制限だし、通話も楽天linkで無料。
エリア外でも、5Gまで無料、また、5Gを使った後は、1Mbpsで利用できるので、実質無制限に等しい。
おそらく、このままだと、儲けはほとんどゼロのはずなので、楽天市場への流入とか、金融や楽天カードを使わせて楽天経済圏の中にどっぷり入ってもらうという戦略になるのでしょう。

1年間は無料なので、楽天モバイルとdocomoを併用しつつ、1年後にどっちをメインに使うか考えたいと思います。

nice!(0)  コメント(0) 
共通テーマ:パソコン・インターネット

【新型コロナウィルス】木場公園で遊ぶ [ファミリー]

木場公園に遊びに行きました。
いつもより子供の数は多かった気がしますが、特に気にならないレベル。



コロナの死亡率は、季節性インフルエンザの数倍から10倍程度。
決して高くなく、必要以上に大げさに経済活動を停止することの害が問題な気がします。
高齢者を自立的に隔離しつつ、なるべく感染しないような生活を送るという、基本的な生活を送ることが大切ですよね。

また、インフルは、子供から大人までほぼ均等にかかってしまいますが、新型コロナの場合は、重篤化しやすいリスクの高い人と高くない
人の傾向がはっきりしているので、そういう意味では脅威はインフル以下かもしれません。

人との接触を8割削減してということを打ち出していますが、本当に必要なのかなって思います。

nice!(4)  コメント(0) 
共通テーマ:育児

新型コロナウィルス、韓国を見習う? [時事 / ニュース]

新型コロナウィルスで中国と韓国で改善があります。

まず、中国から。
元気な人(自覚症状がない人)は、検査せずに、肺炎の疑いがある人に対しウィルス検査をしてケアをするという方針になっているようです。
なので、中国から出てくる数字はあまりあてになりません。
元気な人(自覚症状がない人)は、検査しないということに関しては賛否両論ありますが、おそらく若年層にとってみれば、インフルエンザに近いただの風邪に近いんだと思います。

なので、慌てず騒がず、重篤な人のためにベッドを用意しておいて、元気な人は普通の生活を送ってもらう、というやり方に変えたのが中国。
そして、経済も復活し始めています。

続いて、韓国。
ロックダウンしないでコロナを制圧した国ということで、みんな韓国の真似をしましょうという意見が見られます。
たくさん検査をしてどうのこうのと。
ただ、中国同様に韓国から上がってくる数字の信ぴょう性ってどうなんでしょうか。
検査の精度もイマイチで、偽陽性、偽陰性が高い検査をしまくってもあまり意味がない気がします。
また、コロナを制圧できた大きな理由が、コロナになった人の個人情報無視して、今、どこどこにいるとかって情報を流しまくっています。
日本を含めて欧米諸国は、こういうことをしようものなら、メディアが袋叩きにします。
そういうメディアが韓国の真似をしましょうって推進するのはすこし滑稽ですが・・・

いずれにしろ、日本は日本の法律の中でしかできないことも多く、頑張っている方だと個人的に思います。

nice!(0)  コメント(0) 
共通テーマ:ニュース

数学や統計は暗記 [データサイエンス、統計モデル]

大学の先生(20代の時)が数学は暗記だとよく言っていました。
RやPythonのコードを覚えたり、数式を覚えたり、定理や定義を覚えたり。

「暗記」ということですが、効率が良い暗記は、忘れる前に復習するというのは間違いみたいです。
忘れた後に、後悔しながら思い出し、復習することで、中長期の記憶として残る。


自分を操る超集中力

自分を操る超集中力

  • 作者: メンタリストDaiGo
  • 出版社/メーカー: かんき出版
  • 発売日: 2016/05/27
  • メディア: 単行本(ソフトカバー)



また、記憶する際には集中力が必要ですが、ジャンクフードなどは1週間で脳がおかしくなるそうです。
最近、運動不足で太り気味なので、ジャンクフードも減らさないとなって思います。

nice!(0)  コメント(0) 
共通テーマ:学問

レゴ人形と算数ブロック [ファミリー]

小学5年生と2年生の息子と娘が、小学校の算数ブロックとレゴ人形を使って、作品を作っていました。



どんな作品かは写真を見れば、すぐにわかると思いますが、なかなかの力作。

写真も自分たちで撮っていたのですが、ポートレート機能を駆使しながら、自分たちで遠近感が出る写真を撮っていました。

遊びながら新しい機器を覚える感覚ってのは、子供ならではですね。

nice!(3)  コメント(0) 
共通テーマ:育児

統計検定:2017年11月 問15について [データサイエンス、統計モデル]

統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。

【質問】
2017年11月 問15の問題を母比率の差の検定を使ったが、やり方が正しいか?

【回答】
似ていますが、母比率の差の検定を使うのではなく、適合度検定を使うのが正しい方法となります。

母比率の差の検定を使う方法

> A.B.res <- c(5, 12, 33)
> A.B.pop <- c(20, 30, 50)
> prop.test(A.B.res, A.B.pop)

母比率の差の検定ですが、
20人中5人(25%)、30人中12人(40%)、33人中50人(50%)とした時、
25%, 40%, 50%は同じ確率か?ということを検定しています。

検定結果は、
3-sample test for equality of proportions without continuity correction

data: A.B.res out of A.B.pop
X-squared = 11.32, df = 2, p-value = 0.003483
alternative hypothesis: two.sided
sample estimates:
prop 1 prop 2 prop 3
0.25 0.40 0.66
となっています。

p値が0.05よりも小さいので同じ比率ではないという結果になります。

一方、統計検定2級の過去問 2017年11月 問15ですが、
50人がくじを引いた時、
1等5人(理論値10人)、2等12人(理論値15人)、ハズレ33人(理論値25人)
となっており、
理論値の比率と比べて、
5人⇄10人(理論値:0.2)
12人⇄15人(理論値:0.3)
33人⇄25人(理論値:0.5)
同じような比率になっているか?を検定しています。
こちらは、適合度検定と呼ばれています。

> chisq.test(c(5, 12, 33), p = c(0.2, 0.3, 0.5))

Chi-squared test for given probabilities

data: c(5, 12, 33)
X-squared = 5.66, df = 2, p-value = 0.05901

この時の結果の読み方ですが、
検定統計量(カイ二乗値)は、5.66となります。
自由度は(3-1)x(2-1)=2です。

p値は、0.05901となり、一般的な0.05基準だとわずかに大きいため
帰無仮説は棄却されません。

nice!(3)  コメント(0) 
共通テーマ:学問