-
pandasを使用したグループ化と集計 pandasはデータ分析ライブラリであり、groupby関数を使用してデータをグループ化し、集計することができます。以下は、例です。
import pandas as pd # データを読み込む data = pd.read_csv('data.csv') # グループ化して要約統計量を計算する summary = data.groupby('カラム名').agg({'集計対象カラム': ['mean', 'sum', 'count']}) # 結果を表示する print(summary)
このコードでは、'カラム名'で指定されたカラムでデータをグループ化し、'集計対象カラム'の平均、合計、および件数を計算しています。
-
SQLを使用したグループ化と集計 データベースを使用している場合、SQLを使ってデータをグループ化し、集計することもできます。以下は、例です。
SELECT カラム名, COUNT(*) AS 件数, AVG(集計対象カラム) AS 平均, SUM(集計対象カラム) AS 合計 FROM テーブル名 GROUP BY カラム名;
このSQLクエリは、'テーブル名'で指定されたテーブルを'カラム名'でグループ化し、'集計対象カラム'の件数、平均、および合計を計算します。
-
NumPyを使用したグループ化と集計 NumPyは数値計算ライブラリであり、データのグループ化と集計にも使用できます。以下は、例です。
import numpy as np # グループ化するカテゴリ配列 categories = np.array(['カテゴリA', 'カテゴリB', 'カテゴリA', 'カテゴリB']) # 集計対象の数値配列 values = np.array([1, 2, 3, 4]) # グループごとの合計を計算する summary = np.bincount(categories, weights=values) # 結果を表示する print(summary)
このコードでは、'categories'の値に基づいて'values'をグループ化し、各グループの合計を計算しています。
これらはデータをグループ化して要約するためのいくつかの方法の例です。データの形式や分析の目的に応じて、最適な方法を選択してください。