- ピアソン相関係数の計算: ピアソン相関係数は、2つの連続的な変数間の線形関係を測定するために使用されます。例えば、データセット内の気温とアイスクリームの売上数の間の関係を調べる場合、ピアソン相関係数を計算することができます。以下はPythonでの計算例です。
import pandas as pd
# データ読み込み
data = pd.read_csv('data.csv')
# ピアソン相関係数の計算
correlation = data['気温'].corr(data['売上数'])
print("ピアソン相関係数:", correlation)
- スピアマン相関係数の計算: スピアマン相関係数は、2つの変数間の順位の相関を測定するために使用されます。順位データや非線形関係がある場合に有効です。以下はPythonでの計算例です。
import pandas as pd
# データ読み込み
data = pd.read_csv('data.csv')
# スピアマン相関係数の計算
correlation = data['順位データ1'].corr(data['順位データ2'], method='spearman')
print("スピアマン相関係数:", correlation)
- 相関行列の可視化: 相関行列は、データセット内のすべての変数間の相関関係を示す行列です。相関行列を可視化することで、変数間のパターンやクラスタリングを視覚的に理解することができます。以下はPythonのSeabornライブラリを使用した相関行列の可視化例です。
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# データ読み込み
data = pd.read_csv('data.csv')
# 相関行列の計算
correlation_matrix = data.corr()
# 相関行列の可視化
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')
plt.title("相関行列")
plt.show()
これらの例は、相関クエリを使用してデータセット内の変数間の関係性を分析する方法を示しています。実際のデータセットに応じて、さまざまな相関クエリの手法やツールを活用することができます。