-
データベースへの接続とデータの取得: PostgreSQLに接続し、データベースからデータを取得する方法です。以下は、Pythonのpsycopg2ライブラリを使用した例です。
import psycopg2 conn = psycopg2.connect(database="your_database", user="your_user", password="your_password", host="your_host", port="your_port") cursor = conn.cursor() cursor.execute("SELECT * FROM your_table") data = cursor.fetchall() conn.close()
-
データのPandasデータフレームへの変換: 取得したデータをPandasのデータフレームとして扱うために変換する方法です。以下は、Pandasの
DataFrame()
関数を使用した例です。import pandas as pd df = pd.DataFrame(data, columns=["column1", "column2", "column3"])
-
データの基本的な統計情報の計算: データフレームを使用して、基本的な統計情報(平均、中央値、最小値、最大値など)を計算する方法です。以下は、Pandasの
describe()
関数を使用した例です。statistics = df.describe()
-
データのグループ化と集計: データを特定のカテゴリでグループ化し、集計する方法です。以下は、Pandasの
groupby()
関数と集計関数(例:sum()
、mean()
)を使用した例です。grouped_data = df.groupby("category")["value"].sum()
-
データの可視化: 取得したデータをグラフや図表として可視化する方法です。以下は、Pandasの
plot()
関数を使用した例です。df.plot(x="x_column", y="y_column", kind="line")
これらの基本的な手法とコード例を使って、PostgreSQLとPandasを組み合わせてデータ分析を行うことができます。さまざまなデータ操作や分析手法を組み合わせることで、より高度な分析が可能になります。