方法1: isnull()とsum()を使用する方法
import pandas as pd
# データフレームの作成
df = pd.DataFrame({'A': [1, 2, None, 4, None],
'B': [5, None, 7, 8, None],
'C': [None, 10, 11, None, 13]})
# 各列ごとの欠損値の数をカウント
missing_values_count = df.isnull().sum()
print(missing_values_count)
出力:
A 2
B 2
C 2
dtype: int64
方法2: isna()とsum()を使用する方法
import pandas as pd
# データフレームの作成
df = pd.DataFrame({'A': [1, 2, None, 4, None],
'B': [5, None, 7, 8, None],
'C': [None, 10, 11, None, 13]})
# 各列ごとの欠損値の数をカウント
missing_values_count = df.isna().sum()
print(missing_values_count)
出力:
A 2
B 2
C 2
dtype: int64
方法3: count()とlen()を使用する方法
import pandas as pd
# データフレームの作成
df = pd.DataFrame({'A': [1, 2, None, 4, None],
'B': [5, None, 7, 8, None],
'C': [None, 10, 11, None, 13]})
# 各列ごとの非欠損値の数をカウント
non_missing_values_count = df.count()
# 各列の欠損値の数を計算
missing_values_count = len(df) - non_missing_values_count
print(missing_values_count)
出力:
A 2
B 2
C 2
dtype: int64
これらの方法を使用すると、Pandasを使ってデータセット内の欠損値の数を正確にカウントすることができます。これにより、データ分析や前処理の段階で欠損値を適切に取り扱うことができます。