2つの列の組み合わせに基づいて重複を削除する方法


方法1: pandasライブラリを使用する方法

import pandas as pd
# データフレームを作成する
df = pd.DataFrame({'列1': [1, 1, 2, 2, 3],
                   '列2': ['A', 'B', 'A', 'B', 'C'],
                   '列3': ['X', 'Y', 'Z', 'X', 'Y']})
# 重複を削除する
df_unique = df.drop_duplicates(subset=['列1', '列2'])
# 結果を表示する
print(df_unique)

方法2: Pythonの組み込みセットを使用する方法

data = [('A', 'B'), ('A', 'B'), ('C', 'D'), ('C', 'D'), ('E', 'F')]
unique_data = set()
for item in data:
    unique_data.add(item)
# 結果を表示する
for item in unique_data:
    print(item)

方法3: SQLのDISTINCTキーワードを使用する方法

SELECT DISTINCT 列1, 列2
FROM テーブル名;

上記の方法を使用すると、特定の列の組み合わせに基づいて重複を削除できます。適用する方法は、使用しているプログラミング言語やデータベースによって異なる場合があります。ご利用の環境に合わせて適切な方法を選択してください。