データフレームの欠損値の割合を計算する方法


sumを使用する方法

import pandas as pd
# データフレームの作成(例)
df = pd.DataFrame({'A': [1, 2, None, 4, None],
                   'B': [5, None, 7, None, 9]})
# 欠損値の割合を計算
missing_percentage = df.isna().sum() / len(df) * 100
# 結果の表示
print(missing_percentage)

このコードでは、isna()関数を使用して欠損値の箇所をTrueとしてマークし、sum()関数を使用して列ごとにTrueの数を合計します。その後、データフレームの総数で割り、100をかけることで欠損値の割合を計算します。

方法2:isnameanを使用する方法

import pandas as pd
# データフレームの作成(例)
df = pd.DataFrame({'A': [1, 2, None, 4, None],
                   'B': [5, None, 7, None, 9]})
# 欠損値の割合を計算
missing_percentage = df.isna().mean() * 100
# 結果の表示
print(missing_percentage)

このコードでは、mean()関数を使用してTrueの割合を計算します。mean()関数は、Trueを1、Falseを0として解釈し、列ごとの平均を計算します。