Rを使って平均値の95%信頼区間を計算する方法 [データサイエンス、統計モデル]
統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
平均値は、mean(dat)で計算できますが、95%信頼区間ってどう計算するのか?
【回答】
以下、irisのデータを使った例を書きます。
# irisのSepal.Lengthを最初から10レコード取得
dat <- head(iris$Sepal.Length, n=10)
dat(Sepal.Length)の平均値の95%信頼区間を求める方法
やり方は2つあります。
計算方法 その1
まず、母平均の「信頼区間」を求める式を使うやり方です。
標本平均 ± t値 × 標本標準偏差 ÷ √標本の数
で計算できます。
Rのコードで書くと
標本平均: mean(dat)
t値: qt(0.025, 9) or qt(0.975, 9)
標本標準偏差: sd(dat)
√標本の数: 10^0.5
これらをつなげると、下記となります。
mean(dat)+qt(0.025, 9)*sd(dat)/10^0.5
mean(dat)+qt(0.975, 9)*sd(dat)/10^0.5
t値: qt(0.025, 9) を補足しておくと、
95%信頼区間ですが、今回は両側検定となるため、0.025, 0.097となります。
また、自由度は一つ減って10-1=9となっていることに注意が必要です。
計算方法 その2
Rのt.testを使えば、一行で答えが出てきます。
t.test(dat)
One Sample t-test
data: dat
t = 52.749, df = 9, p-value = 1.589e-12
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
4.651576 5.068424
sample estimates:
mean of x
4.86
ここから、平均値の95%信頼区間は、
4.651576 〜 5.068424
となりました。
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
平均値は、mean(dat)で計算できますが、95%信頼区間ってどう計算するのか?
【回答】
以下、irisのデータを使った例を書きます。
# irisのSepal.Lengthを最初から10レコード取得
dat <- head(iris$Sepal.Length, n=10)
dat(Sepal.Length)の平均値の95%信頼区間を求める方法
やり方は2つあります。
計算方法 その1
まず、母平均の「信頼区間」を求める式を使うやり方です。
標本平均 ± t値 × 標本標準偏差 ÷ √標本の数
で計算できます。
Rのコードで書くと
標本平均: mean(dat)
t値: qt(0.025, 9) or qt(0.975, 9)
標本標準偏差: sd(dat)
√標本の数: 10^0.5
これらをつなげると、下記となります。
mean(dat)+qt(0.025, 9)*sd(dat)/10^0.5
mean(dat)+qt(0.975, 9)*sd(dat)/10^0.5
t値: qt(0.025, 9) を補足しておくと、
95%信頼区間ですが、今回は両側検定となるため、0.025, 0.097となります。
また、自由度は一つ減って10-1=9となっていることに注意が必要です。
計算方法 その2
Rのt.testを使えば、一行で答えが出てきます。
t.test(dat)
One Sample t-test
data: dat
t = 52.749, df = 9, p-value = 1.589e-12
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
4.651576 5.068424
sample estimates:
mean of x
4.86
ここから、平均値の95%信頼区間は、
4.651576 〜 5.068424
となりました。
【東京五輪チケット】申し込みは5月9日開始 [時事 / ニュース]
1年以上先の話ですが、東京オリンピック2020のチケットが販売開始されますね。
どの種目を見るかってのもありますが、日程的にその日仕事とかいろいろ入ってこないかな、、、という心配もあります。
でもせっかくなので、入場式とか見てみたいですね。
どの種目を見るかってのもありますが、日程的にその日仕事とかいろいろ入ってこないかな、、、という心配もあります。
でもせっかくなので、入場式とか見てみたいですね。
『統計+R講座 | AIジョブカレ』第9期の申込み [データサイエンス、統計モデル]
統計+R講座 | AIジョブカレ
https://www.aijobcolle.com/toukei
『統計+R講座 | AIジョブカレ』ですが、第9期の申込みが始まるとのことです。
初回(1回目)は、6月21日(金)スタートらしい。
自分が教えて、今回は、4期目(3期、5期、7期、9期)となります。
毎回、参加される受講生のレベルを観ながら、授業の反応を観ながら、少しずつ教える内容やレベルは変えているつもりですが、なかなかすべての人に満足してもらえるように教えるのは難しいものですね。
統計検定2級程度なので、統計学超初心者だとちょっと難しいかもしれませんが、マーケティングで使える統計を学びたい方、原理原則を見直したい方はおすすめかもしれません。
https://www.aijobcolle.com/toukei
『統計+R講座 | AIジョブカレ』ですが、第9期の申込みが始まるとのことです。
初回(1回目)は、6月21日(金)スタートらしい。
自分が教えて、今回は、4期目(3期、5期、7期、9期)となります。
毎回、参加される受講生のレベルを観ながら、授業の反応を観ながら、少しずつ教える内容やレベルは変えているつもりですが、なかなかすべての人に満足してもらえるように教えるのは難しいものですね。
統計検定2級程度なので、統計学超初心者だとちょっと難しいかもしれませんが、マーケティングで使える統計を学びたい方、原理原則を見直したい方はおすすめかもしれません。
日本橋高島屋で「平成最後の」皇室展 [よもやま日記]
ネスプレッソのコーヒーカプセルを買いに日本橋高島屋店に寄ったら
「国民とともに歩まれた平成の30年」のイベントをやっていました。
御成婚記念パレードの儀装馬車が特別展示されていました。
さて、ネスプレッソのポーションですが、4月23日より3種類の定番コーヒーが追加されるとか。
こちらも楽しみです♪
「国民とともに歩まれた平成の30年」のイベントをやっていました。
御成婚記念パレードの儀装馬車が特別展示されていました。
さて、ネスプレッソのポーションですが、4月23日より3種類の定番コーヒーが追加されるとか。
こちらも楽しみです♪
お台場海浜公園デビュー [ファミリー]
今日は、夏?と思ってしまいそうなくらい暑かった。
お天気も良いのでお台場海浜公園に行ってきました。
次男君は、お台場海浜公園初めて。
赤ちゃんだと砂を食べたりするのですが、そういうこともせず、穏やかに遊んでいました。
近くを歩いている鳩に反応して、ハイハイしながら追いかけて行っていました。
声をかけなかったら、どこまでハイハイしてそうだったので、名前を呼ぶと戻ってきました。
まだ、10か月ですが、気を付けないと、迷子になりそうな性格です。。。
↑
※ 当然ですが、フタは空いておりません。w
お天気も良いのでお台場海浜公園に行ってきました。
次男君は、お台場海浜公園初めて。
赤ちゃんだと砂を食べたりするのですが、そういうこともせず、穏やかに遊んでいました。
近くを歩いている鳩に反応して、ハイハイしながら追いかけて行っていました。
声をかけなかったら、どこまでハイハイしてそうだったので、名前を呼ぶと戻ってきました。
まだ、10か月ですが、気を付けないと、迷子になりそうな性格です。。。
↑
※ 当然ですが、フタは空いておりません。w
【LOGOSとの特別共同企画】Q-TOP フルシェード ミッキー&フレンズ Outdoor Camp [Disney / ディズニー]
ディズニーとLOGOSがコラボ
https://skellington.blog.so-net.ne.jp/2019-04-12
↑
こちらの記事を書きましたが、テントがずっと気になっていました。。。
【LOGOSとの特別共同企画】Q-TOP フルシェード ミッキー&フレンズ Outdoor Camp
https://store.disney.co.jp/g/g4936313757156
宿泊用のテントはあるのですが、公園に行ったときとかに簡易に広げるテントが欲しいなぁと思っていました。
動画をみると30秒で簡単に&一人で作れるテントなので、買ってしまいました♪
後、子供用のイスも。
【LOGOSとの特別共同企画】タイニーチェア ミッキー&フレンズ Outdoor Camp
https://store.disney.co.jp/g/g4936313757163
https://skellington.blog.so-net.ne.jp/2019-04-12
↑
こちらの記事を書きましたが、テントがずっと気になっていました。。。
【LOGOSとの特別共同企画】Q-TOP フルシェード ミッキー&フレンズ Outdoor Camp
https://store.disney.co.jp/g/g4936313757156
宿泊用のテントはあるのですが、公園に行ったときとかに簡易に広げるテントが欲しいなぁと思っていました。
動画をみると30秒で簡単に&一人で作れるテントなので、買ってしまいました♪
後、子供用のイスも。
【LOGOSとの特別共同企画】タイニーチェア ミッキー&フレンズ Outdoor Camp
https://store.disney.co.jp/g/g4936313757163
北海道シントク町 塚田農場 八重洲北口店 [グルメ / クッキング]
北海道シントク町 塚田農場 八重洲北口店
https://www.hotpepper.jp/strJ001027681/
歓迎会でこちらのお店に。
飲み放題付きで5000円。
料理もたくさん出てきたし、味の方もなかなか美味しかったです。
2時間なので、少し短く感じましたが、全体的に良いお店かと思いました。
https://www.hotpepper.jp/strJ001027681/
歓迎会でこちらのお店に。
飲み放題付きで5000円。
料理もたくさん出てきたし、味の方もなかなか美味しかったです。
2時間なので、少し短く感じましたが、全体的に良いお店かと思いました。
怪獣酒場 カンパーイ! [ウルトラマン]
Microsoftが「パスワードの定期変更は不要」と宣言 [時事 / ニュース]
定期的に変えないと、パスワードが流出した際にリスクが高いというのがこれまででした。
ただ、パスワード変更を頻繁に行うと、人は簡単なパスワードを使うようになるので、むしろ危険になる、とのことでした。
重要なのは、パスワードが流出したと分かったら、すぐにパスワードを変えることらしい。
大手のサイトとかだと、ハッキングされてパスワード流出が検知できますが、小さいサイトだとそもそもパスワードが流出したか不明だったりしますよね。。。
最近では、google chromeを使っていると自動で安全性の高いパスワードを生成してくれたります。
便利になっている反面、googleへの依存度が高くなっています。。。
ただ、パスワード変更を頻繁に行うと、人は簡単なパスワードを使うようになるので、むしろ危険になる、とのことでした。
重要なのは、パスワードが流出したと分かったら、すぐにパスワードを変えることらしい。
大手のサイトとかだと、ハッキングされてパスワード流出が検知できますが、小さいサイトだとそもそもパスワードが流出したか不明だったりしますよね。。。
最近では、google chromeを使っていると自動で安全性の高いパスワードを生成してくれたります。
便利になっている反面、googleへの依存度が高くなっています。。。
明日からゴールデンウィーク [よもやま日記]
いよいよ明日からゴールデンウィーク。
といっても、10連休あるけど、前半はのんびり過ごす予定です。
後半は、忍者村へ。
せっかくの10連休なので、海外にでも行ってみたいですが、ものすっごく高いですよねぇ。。。
もう少し早めに予約しておければ安かったかもしれません。。。
といっても、10連休あるけど、前半はのんびり過ごす予定です。
後半は、忍者村へ。
せっかくの10連休なので、海外にでも行ってみたいですが、ものすっごく高いですよねぇ。。。
もう少し早めに予約しておければ安かったかもしれません。。。
ジュニアパイロットで大阪へ [ファミリー]
長男だけ、一人で大阪へ。
何度か、一人で飛行機に乗っているので、だいぶ慣れた感じがします。
新幹線は、途中で間違えて降りてしまったり、最近では物騒な事件も多いのでちょっと心配。
その反面、飛行機だと、搭乗口まで親が付いて行けるし、到着した後も最後まで面倒を見てくれるので安心です。
このあたりのサービスはJALもANAもあまり差がないです。
ゴールデンウィークの料金は高いですが、子供料金だと大人の半額なので、そこまでビックリする金額ではなかったです。
何度か、一人で飛行機に乗っているので、だいぶ慣れた感じがします。
新幹線は、途中で間違えて降りてしまったり、最近では物騒な事件も多いのでちょっと心配。
その反面、飛行機だと、搭乗口まで親が付いて行けるし、到着した後も最後まで面倒を見てくれるので安心です。
このあたりのサービスはJALもANAもあまり差がないです。
ゴールデンウィークの料金は高いですが、子供料金だと大人の半額なので、そこまでビックリする金額ではなかったです。
確定拠出年金のメンテナンス [マネー]
その昔、確定拠出年金(401k)に移行した際に、何やら設定した記憶があり、
とはいえ、毎月、少額ずつですが、積み立てを行っています。
こういうものって、最初は、どの銘柄にするかけっこう悩みますが、一度決めた後は、あまり運用実績ってみないものですね。。。
ということで、なかなか行えなかった資産運用の見直しをしました。
これまでは、株式の比重が高く、時系列で運用実績を見ると、上がったり下がったりジェットコースターみたいな運用になっていました。
まぁ、全力で株式に突っ込んでも良いと思いますが、少し株式の比重を下げておきました。
とはいえ、毎月、少額ずつですが、積み立てを行っています。
こういうものって、最初は、どの銘柄にするかけっこう悩みますが、一度決めた後は、あまり運用実績ってみないものですね。。。
ということで、なかなか行えなかった資産運用の見直しをしました。
これまでは、株式の比重が高く、時系列で運用実績を見ると、上がったり下がったりジェットコースターみたいな運用になっていました。
まぁ、全力で株式に突っ込んでも良いと思いますが、少し株式の比重を下げておきました。
モンベルクラブ・フレンドフェア2019春 [登山、クライミング]
モンベルのイベントに行ってきました。
混んでいるかと思ったけど、会員限定だけあってそれほど混んでいませんでした。
クライミングがあったり、各地の観光案内やっていました。
なんだかんだと2時間くらい遊ぶことができて、満足♪
混んでいるかと思ったけど、会員限定だけあってそれほど混んでいませんでした。
クライミングがあったり、各地の観光案内やっていました。
なんだかんだと2時間くらい遊ぶことができて、満足♪
平成最後の日 [自己紹介 / 挨拶]
朝から平成の特集がテレビで流れています。
そういえば、自分にとっての平成ってなんだったんだろう、と改めて考えてみました。
平成元年は、1989年。
中学校から高校に進学した年なんですね。。。
当時は、宇宙物理学者になりたいと思いながら、ニュートンの雑誌をよく読んでいました。
まぁ、ほとんど雰囲気しか分からず、それでも宇宙ってどうなっているんだろう、と想像するのが楽しかったのを覚えています。
そんなこんなで大学、就職。
気が付けば、20年近く分析の仕事をしています。
今では機械学習とかAIとかそういう言葉がブームになっているのですが、大学ではもっと基礎的な統計というものを研究していました。
当時、思っていた仕事をしているわけじゃないけど、自分が想像していた以上に楽しい仕事が出来ていると思ってます。
そして、令和の時代へ。
数年後、数十年後、どんな仕事をしているのかまだ、想像できませんが、今、自分が思い描く以上の仕事を出来るように、これからも精進し続けたいと思います。
そういえば、自分にとっての平成ってなんだったんだろう、と改めて考えてみました。
平成元年は、1989年。
中学校から高校に進学した年なんですね。。。
当時は、宇宙物理学者になりたいと思いながら、ニュートンの雑誌をよく読んでいました。
まぁ、ほとんど雰囲気しか分からず、それでも宇宙ってどうなっているんだろう、と想像するのが楽しかったのを覚えています。
そんなこんなで大学、就職。
気が付けば、20年近く分析の仕事をしています。
今では機械学習とかAIとかそういう言葉がブームになっているのですが、大学ではもっと基礎的な統計というものを研究していました。
当時、思っていた仕事をしているわけじゃないけど、自分が想像していた以上に楽しい仕事が出来ていると思ってます。
そして、令和の時代へ。
数年後、数十年後、どんな仕事をしているのかまだ、想像できませんが、今、自分が思い描く以上の仕事を出来るように、これからも精進し続けたいと思います。