dplyrのsummarise_all()について [よもやま日記]
統計のRソフトの話。
unixのパイプ感覚でデータ集計が出来るやり方です。
# dplyrのライブラリを使ってデータ加工を行います。
library(dplyr)
iris %>%
group_by(Species) %>%
summarise_all(funs(mean))
# summarise_each(funs(mean)) は、将来的になくなる方向とのこと。
iris %>% group_by(Species) %>% summarise_all(funs(mean))
↑
この意味ですが、
iris のデータを渡して、
Species でSQLで使うgroup byします。
そのデータに対して、平均(mean)を取るという処理を行っています。
mean以外にも、min, max ,sum, sdなどの関数を使うことができます。
unixのパイプ感覚でデータ集計が出来るやり方です。
# dplyrのライブラリを使ってデータ加工を行います。
library(dplyr)
iris %>%
group_by(Species) %>%
summarise_all(funs(mean))
# summarise_each(funs(mean)) は、将来的になくなる方向とのこと。
iris %>% group_by(Species) %>% summarise_all(funs(mean))
↑
この意味ですが、
iris のデータを渡して、
Species でSQLで使うgroup byします。
そのデータに対して、平均(mean)を取るという処理を行っています。
mean以外にも、min, max ,sum, sdなどの関数を使うことができます。