Pandasを使用してデータフレームの列名をクリーンにする方法


Pandasは、データフレームを操作するための強力なツールです。データフレームの列名をクリーンにする必要がある場合、以下の方法を使用することができます。

  1. 列名の修正: データフレームの列名にスペース、記号、または大文字小文字の混在がある場合、これらを修正することができます。例えば、以下のコードを使用して列名を小文字に変換します。
df.columns = df.columns.str.lower()

または、スペースや記号をアンダースコアに置換するには、str.replace() メソッドを使用できます。

df.columns = df.columns.str.replace(' ', '_')
df.columns = df.columns.str.replace('[^\w\s]', '')
  1. 列名の置換: 特定の列名を別の名前に置換する必要がある場合、rename() メソッドを使用できます。以下は、列名 "old_name" を "new_name" に置換する例です。
df.rename(columns={'old_name': 'new_name'}, inplace=True)
  1. 列名の正規化: 列名に含まれる不要な文字列を取り除くために、正規表現を使用することもできます。str.replace() メソッドと正規表現パターンを組み合わせて使用します。以下は、数字と括弧を取り除く例です。
import re
df.columns = [re.sub(r'\d+|\(|\)', '', column) for column in df.columns]

これらの方法を組み合わせて使用することで、データフレームの列名をクリーンにすることができます。適切な方法を選択し、データフレームの要件に応じて適用してください。