- データフレームのインデックスを日時型に変換する: データフレームのインデックスが日時型でない場合、まずは日時型に変換する必要があります。以下のコードを使用して、インデックスを日時型に変換します。
df.index = pd.to_datetime(df.index)
- リサンプリングの方法:
データを時間ごとにリサンプリングするには、
resample()
メソッドを使用します。以下のコード例では、データを1時間ごとに平均値でリサンプリングしています。
resampled_df = df.resample('1H').mean()
- 別のリサンプリング方法:
resample()
メソッドの引数には、リサンプリングする時間の間隔を指定する必要があります。以下のコード例では、データを2時間ごとに合計値でリサンプリングしています。
resampled_df = df.resample('2H').sum()
- リサンプリング時の欠損値の処理:
リサンプリングする際に、元のデータに欠損値が含まれている場合、デフォルトではリサンプリング後のデータも欠損値となります。欠損値を埋める方法としては、
fillna()
メソッドを使用することができます。以下のコード例では、欠損値を前の値で埋める方法を示しています。
resampled_df = df.resample('1H').mean().fillna(method='ffill')
これらは、Pandasを使用してデータを時間ごとにリサンプリングするいくつかの方法です。必要に応じて、リサンプリングの間隔や欠損値の処理方法を変更してください。このようなリサンプリングは、時間に基づくデータの集計や可視化など、さまざまな分析タスクで役立ちます。