Pythonでの決定木の可視化方法


  1. 必要なライブラリのインストール: 決定木の可視化には、以下のライブラリが必要です。

    • scikit-learn: 機械学習ライブラリ
    • graphviz: グラフ描画ツール
    • pydotplus: graphvizとscikit-learnの連携をサポートするライブラリ

    これらのライブラリをインストールするために、次のコマンドを使用します。

    pip install scikit-learn graphviz pydotplus
  2. 決定木モデルの作成: まず、scikit-learnを使用して決定木モデルを作成します。以下は、例としてirisデータセットを使用して決定木モデルを作成するコードです。

    from sklearn.datasets import load_iris
    from sklearn.tree import DecisionTreeClassifier
    from sklearn import tree
    # データセットの読み込み
    iris = load_iris()
    X = iris.data
    y = iris.target
    # 決定木モデルの作成
    clf = DecisionTreeClassifier()
    clf.fit(X, y)
  3. 決定木の可視化: 次に、作成した決定木モデルを可視化します。以下のコードを使用して、決定木をグラフとして表示できます。

    import graphviz
    import pydotplus
    dot_data = tree.export_graphviz(clf, out_file=None, 
                                   feature_names=iris.feature_names,  
                                   class_names=iris.target_names,  
                                   filled=True, rounded=True,  
                                   special_characters=True)
    graph = pydotplus.graph_from_dot_data(dot_data)
    graphviz.Source(graph.to_string())

    これにより、決定木のグラフが表示されます。

決定木の可視化は、モデルの理解やデータの特徴の把握に役立ちます。上記の手順を参考にして、Pythonで決定木を可視化してみてください。