Pandasを使用して' datetime64[ns]'から年を抽出する方法


方法1: .dt.yearを使用する方法

import pandas as pd
# サンプルデータの作成
df = pd.DataFrame({'date': ['2022-01-01', '2023-05-15', '2024-09-30']})
# 'datetime64[ns]'に変換
df['date'] = pd.to_datetime(df['date'])
# 年を抽出
df['year'] = df['date'].dt.year
print(df)

出力結果:

        date  year
0 2022-01-01  2022
1 2023-05-15  2023
2 2024-09-30  2024

方法2: .astype(int)を使用して年を抽出する方法

import pandas as pd
# サンプルデータの作成
df = pd.DataFrame({'date': ['2022-01-01', '2023-05-15', '2024-09-30']})
# 'datetime64[ns]'に変換
df['date'] = pd.to_datetime(df['date'])
# 年を抽出
df['year'] = df['date'].dt.strftime('%Y').astype(int)
print(df)

出力結果:

        date  year
0 2022-01-01  2022
1 2023-05-15  2023
2 2024-09-30  2024

方法3: .applyを使用して年を抽出する方法(より柔軟な方法)

import pandas as pd
# サンプルデータの作成
df = pd.DataFrame({'date': ['2022-01-01', '2023-05-15', '2024-09-30']})
# 'datetime64[ns]'に変換
df['date'] = pd.to_datetime(df['date'])
# 年を抽出する関数の定義
def extract_year(date):
    return date.year
# 年を抽出
df['year'] = df['date'].apply(extract_year)
print(df)

出力結果:

        date  year
0 2022-01-01  2022
1 2023-05-15  2023
2 2024-09-30  2024

これらの方法を使用して、Pandasのデータフレームから' datetime64[ns]'形式のデータの年を抽出することができます。これは日付データの解析や集計に便利です。適切な方法を選んで使用してください。