Home > Spark SQL


Coursera Spark SQLで最大カウントを取得する方法

単純なカウントの取得: 最初に、データセット内の特定のカラムの最大カウントを取得する基本的な方法を紹介します。以下のコードを使用します。import org.apache.spark.sql.functions._ val df = spark.read.format("csv").option("header", "true").load("data.csv") val maxCount = df.groupBy("column_name").count().agg(max("count")).head().getLong(0) println("最大カウント: " + maxCount)>>More