dplyrを使用して複数の列の平均を計算する方法


まず、dplyrパッケージをインストールして読み込みます。

install.packages("dplyr")
library(dplyr)

次に、使用するデータセットを準備します。ここでは、irisデータセットを例として使用します。

data(iris)

複数の列の平均値を計算するには、select関数を使用して対象の列を選択し、summarize関数を使用して平均を計算します。以下の例では、Sepal.LengthSepal.Widthの2つの列の平均を計算しています。

iris %>%
  select(Sepal.Length, Sepal.Width) %>%
  summarize(avg_Sepal_Length = mean(Sepal.Length),
            avg_Sepal_Width = mean(Sepal.Width))

このコードでは、select関数でSepal.LengthSepal.Widthの2つの列を選択し、summarize関数でそれぞれの列の平均を計算しています。計算結果は新しい列として表示されます。

もし、すべての数値列の平均を計算したい場合は、select_if関数を使用することもできます。以下の例では、すべての数値列の平均を計算しています。

iris %>%
  select_if(is.numeric) %>%
  summarize_all(mean)

このコードでは、select_if関数で数値列を選択し、summarize_all関数ですべての列の平均を計算しています。

以上の方法を使うことで、dplyrを使用して複数の列の平均を計算することができます。適切なデータセットと列を選択し、必要に応じてコードを調整してください。