PythonのPandasを使用してフォルダ内のすべてのCSVファイルをマージする方法


PythonのPandasライブラリを使用して、特定のフォルダ内のすべてのCSVファイルをマージする方法を紹介します。これにより、複数のCSVファイルからのデータを一つのデータフレームに結合することができます。

以下に、シンプルで簡単な方法といくつかのコード例を示します。

import pandas as pd
import os
# フォルダ内のすべてのCSVファイル名を取得する
folder_path = 'フォルダのパス'
csv_files = [file for file in os.listdir(folder_path) if file.endswith('.csv')]
# マージするための空のデータフレームを作成する
merged_df = pd.DataFrame()
# フォルダ内の各CSVファイルを読み込んでマージする
for file in csv_files:
    file_path = os.path.join(folder_path, file)
    df = pd.read_csv(file_path)
    merged_df = pd.concat([merged_df, df])
# マージされたデータフレームを出力する
print(merged_df)
# マージされたデータフレームをCSVファイルとして保存する
merged_df.to_csv('マージ結果.csv', index=False)

このコードは、指定したフォルダ内のすべてのCSVファイルを読み込み、concat関数を使用してデータをマージしています。最終的なマージ結果は、merged_dfデータフレームに保存され、コンソールに表示されます。また、to_csvメソッドを使用してマージ結果を新しいCSVファイルとして保存することもできます。

この方法を使用すると、簡単かつ効率的に複数のCSVファイルをマージすることができます。