- ヒストグラム: ヒストグラムは、連続変数の分布を可視化するために使用されます。データの範囲をいくつかのバケットに分割し、各バケット内のデータの出現頻度を示します。PythonのMatplotlibライブラリを使用して、以下のようにヒストグラムを作成できます。
import matplotlib.pyplot as plt
plt.hist(data['variable'], bins=10)
plt.xlabel('Variable')
plt.ylabel('Frequency')
plt.title('Histogram of Variable')
plt.show()
- 散布図: 散布図は、2つの連続変数の関係を視覚化するために使用されます。各データポイントは、x軸とy軸上の座標で表されます。PythonのMatplotlibを使用して、以下のように散布図を作成できます。
plt.scatter(data['variable1'], data['variable2'])
plt.xlabel('Variable 1')
plt.ylabel('Variable 2')
plt.title('Scatter Plot of Variable 1 vs Variable 2')
plt.show()
- バープロット: バープロットは、カテゴリ変数の分布や異なるカテゴリ間の比較を可視化するために使用されます。各カテゴリは、バーの高さで表されます。PythonのSeabornライブラリを使用して、以下のようにバープロットを作成できます。
import seaborn as sns
sns.barplot(x='variable1', y='variable2', data=data)
plt.xlabel('Variable 1')
plt.ylabel('Variable 2')
plt.title('Bar Plot of Variable 1 vs Variable 2')
plt.show()
これらは、変数ごとのプロットの一部です。他にもボックスプロット、ラインプロット、ヒートマップなど、さまざまなプロット方法があります。データの特性に応じて最適なプロットを選択し、データ分析を進めてください。