まず、SeabornとMatplotlibをインストールする必要があります。次のコマンドを使用して、必要なパッケージをインストールします。
pip install seaborn matplotlib
インストールが完了したら、以下のコードを使用してSeabornをインポートします。
import seaborn as sns
import matplotlib.pyplot as plt
次に、散布図を作成するために使用するデータを用意します。例として、XとYという2つの数値列を持つDataFrameを作成します。
import pandas as pd
data = pd.DataFrame({'X': [1, 2, 3, 4, 5], 'Y': [2, 4, 6, 8, 10]})
データが準備できたら、Seabornのscatterplot
関数を使用して散布図を作成することができます。
sns.scatterplot(data=data, x='X', y='Y')
plt.show()
上記のコードでは、data
引数に作成したDataFrameを指定し、x
とy
引数には散布図のX軸とY軸に使用する列名を指定しています。
さらに、Seabornの散布図では、さまざまな要素をカスタマイズすることもできます。たとえば、点の色やサイズを変更することができます。
sns.scatterplot(data=data, x='X', y='Y', color='red', s=100)
plt.show()
上記の例では、color
引数を使用して点の色を赤に変更し、s
引数を使用して点のサイズを100に設定しています。
さらに、Seabornには他のデータの要素との関係を表現するための機能もあります。たとえば、散布図に回帰直線を追加することができます。
sns.regplot(data=data, x='X', y='Y')
plt.show()
上記の例では、regplot
関数を使用して回帰直線を追加しています。
これらはSeabornを使用して散布図を作成するための基本的な方法です。さまざまなパラメータや機能を試して、データを効果的に可視化する方法を探索してみてください。