SSブログ

dplyrのsummarise_all()について [よもやま日記]

統計のRソフトの話。
unixのパイプ感覚でデータ集計が出来るやり方です。

# dplyrのライブラリを使ってデータ加工を行います。
library(dplyr)

iris %>%
group_by(Species) %>%
summarise_all(funs(mean))
# summarise_each(funs(mean)) は、将来的になくなる方向とのこと。

iris %>% group_by(Species) %>% summarise_all(funs(mean))

この意味ですが、
iris のデータを渡して、
Species でSQLで使うgroup byします。

そのデータに対して、平均(mean)を取るという処理を行っています。

mean以外にも、min, max ,sum, sdなどの関数を使うことができます。

nice!(5)  コメント(0) 
共通テーマ:学問

nice! 5

コメント 0