まず、dplyrパッケージをインストールして読み込みます。
install.packages("dplyr")
library(dplyr)
次に、使用するデータセットを準備します。ここでは、irisデータセットを例として使用します。
data(iris)
複数の列の平均値を計算するには、select
関数を使用して対象の列を選択し、summarize
関数を使用して平均を計算します。以下の例では、Sepal.Length
とSepal.Width
の2つの列の平均を計算しています。
iris %>%
select(Sepal.Length, Sepal.Width) %>%
summarize(avg_Sepal_Length = mean(Sepal.Length),
avg_Sepal_Width = mean(Sepal.Width))
このコードでは、select
関数でSepal.Length
とSepal.Width
の2つの列を選択し、summarize
関数でそれぞれの列の平均を計算しています。計算結果は新しい列として表示されます。
もし、すべての数値列の平均を計算したい場合は、select_if
関数を使用することもできます。以下の例では、すべての数値列の平均を計算しています。
iris %>%
select_if(is.numeric) %>%
summarize_all(mean)
このコードでは、select_if
関数で数値列を選択し、summarize_all
関数ですべての列の平均を計算しています。
以上の方法を使うことで、dplyrを使用して複数の列の平均を計算することができます。適切なデータセットと列を選択し、必要に応じてコードを調整してください。