Pandasを使用して欠損値の数をカウントする方法


方法1: isnull()とsum()を使用する方法

import pandas as pd
# データフレームの作成
df = pd.DataFrame({'A': [1, 2, None, 4, None],
                   'B': [5, None, 7, 8, None],
                   'C': [None, 10, 11, None, 13]})
# 各列ごとの欠損値の数をカウント
missing_values_count = df.isnull().sum()
print(missing_values_count)

出力:

A    2
B    2
C    2
dtype: int64

方法2: isna()とsum()を使用する方法

import pandas as pd
# データフレームの作成
df = pd.DataFrame({'A': [1, 2, None, 4, None],
                   'B': [5, None, 7, 8, None],
                   'C': [None, 10, 11, None, 13]})
# 各列ごとの欠損値の数をカウント
missing_values_count = df.isna().sum()
print(missing_values_count)

出力:

A    2
B    2
C    2
dtype: int64

方法3: count()とlen()を使用する方法

import pandas as pd
# データフレームの作成
df = pd.DataFrame({'A': [1, 2, None, 4, None],
                   'B': [5, None, 7, 8, None],
                   'C': [None, 10, 11, None, 13]})
# 各列ごとの非欠損値の数をカウント
non_missing_values_count = df.count()
# 各列の欠損値の数を計算
missing_values_count = len(df) - non_missing_values_count
print(missing_values_count)

出力:

A    2
B    2
C    2
dtype: int64

これらの方法を使用すると、Pandasを使ってデータセット内の欠損値の数を正確にカウントすることができます。これにより、データ分析や前処理の段階で欠損値を適切に取り扱うことができます。