Pandasのデータリーダー:データの読み込みと分析方法


  1. CSVファイルの読み込み: CSVファイルはデータをテキスト形式で保存するための一般的な方法です。Pandasのread_csv()関数を使用して、CSVファイルを簡単に読み込むことができます。
import pandas as pd
data = pd.read_csv('data.csv')
print(data.head())
  1. Excelファイルの読み込み: Excelファイルは表形式のデータを保存するための一般的な形式です。Pandasのread_excel()関数を使用して、Excelファイルを読み込むことができます。
import pandas as pd
data = pd.read_excel('data.xlsx')
print(data.head())
  1. JSONファイルの読み込み: JSONファイルはデータを構造化して保存するための一般的な形式です。Pandasのread_json()関数を使用して、JSONファイルを読み込むことができます。
import pandas as pd
data = pd.read_json('data.json')
print(data.head())
  1. SQLデータベースからの読み込み: PandasはSQLデータベースからデータを直接読み込むこともできます。read_sql()関数を使用して、SQLクエリを実行し結果をデータフレームとして取得することができます。
import pandas as pd
import sqlite3
# SQLiteデータベースに接続する
conn = sqlite3.connect('database.db')
# SQLクエリを実行し結果をデータフレームとして取得する
data = pd.read_sql('SELECT * FROM table', conn)
print(data.head())
# データベース接続を閉じる
conn.close()

これらはPandasの一部のデータリーダーの例です。他にも多くのデータリーダーが利用可能であり、データの形式に応じて最適なリーダーを選択できます。データの読み込み後には、Pandasの豊富なデータ処理機能を使用してデータを分析することができます。