Pythonのデータフレーム列の複数条件に基づいた値の選択方法


  1. 単一の条件でフィルタリングする方法: データフレームの特定の列の値が特定の条件を満たす行を選択するには、以下のコードを使用します。

    filtered_df = df[df['列名'] 条件式]

    例えば、列「age」が30より大きい行を選択する場合は、次のようになります。

    filtered_df = df[df['age'] > 30]
  2. 複数の条件でフィルタリングする方法: 複数の条件を組み合わせてデータフレームをフィルタリングするには、条件を括弧で囲み、各条件をビット演算子(&: and, |: or)で結合します。

    filtered_df = df[(条件1) & (条件2)]

    例えば、列「age」が30より大きく、列「gender」が「male」である行を選択する場合は、次のようになります。

    filtered_df = df[(df['age'] > 30) & (df['gender'] == 'male')]

これらの方法を使用することで、データフレームの列の値に基づいて複数の条件を組み合わせてフィルタリングすることができます。適切な条件を指定することで、データの特定の部分集合を選択し、分析することができます。