-
連想の原因: 連想の原因は、データセット内のアイテムや事象の関連性を理解し、意味のある洞察を得るためです。例えば、顧客の購買履歴データから、商品間の関連性を分析することができます。連想分析によって、顧客が一緒に購入する傾向のある商品や、特定の商品を購入するときの他の商品の選択が明らかになります。
-
連想の分析方法: 連想の分析には、さまざまなアルゴリズムや手法があります。代表的な手法として、アプリオリ(Apriori)アルゴリズムやFP-Growthアルゴリズムがあります。これらのアルゴリズムは、頻出アイテムセットを見つけるために使用されます。アプリオリアルゴリズムは、事前に設定した最小サポート閾値を使用して、頻出アイテムセットを抽出します。FP-Growthアルゴリズムは、データセットを圧縮して、頻出アイテムセットを抽出します。
-
コード例: 以下は、Pythonで連想分析を行うための基本的なコード例です。
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori
# サンプルのトランザクションデータセット
dataset = [['商品A', '商品B', '商品C'],
['商品A', '商品B', '商品D'],
['商品B', '商品C'],
['商品A', '商品B', '商品D'],
['商品A', '商品C']]
# トランザクションデータのバイナリエンコーディング
te = TransactionEncoder()
te_ary = te.fit(dataset).transform(dataset)
df = pd.DataFrame(te_ary, columns=te.columns_)
# アプリオリアルゴリズムを使用して頻出アイテムセットを抽出
frequent_itemsets = apriori(df, min_support=0.2, use_colnames=True)
# 結果の表示
print(frequent_itemsets)
このコード例では、mlxtend
ライブラリを使用しています。まず、トランザクションデータセットをバイナリエンコーディングし、DataFrameに変換します。次に、apriori
関数を使用して、最小サポート閾値を指定して頻出アイテムセットを抽出します。最後に、結果を表示します。
このようにして、連想分析の基本的な手法とコード例を紹介しました。連想分析は、さまざまな分野で役立つことがあります。データセット内の関連性を理解し、意思決定やマーケティング戦略の改善に活用することができます。