-
必要なライブラリのインポート: AdaBoostを実装するために、scikit-learnライブラリを使用します。以下のコードで必要なライブラリをインポートします。
from sklearn.ensemble import AdaBoostClassifier from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score
-
データの準備: AdaBoostを適用するためには、分類タスクに適したデータセットが必要です。データセットを用意し、特徴量とラベルを分けます。以下のコードは、データセットをトレーニングセットとテストセットに分割する例です。
X_train, X_test, y_train, y_test = train_test_split(features, labels, test_size=0.2, random_state=42)
-
AdaBoostのモデルの作成と学習: AdaBoostClassifierクラスを使用して、AdaBoostのモデルを作成し、トレーニングセットで学習します。以下のコードは、決定木を弱学習器として使用した場合の例です。
base_estimator = DecisionTreeClassifier(max_depth=1) ada_boost = AdaBoostClassifier(base_estimator=base_estimator, n_estimators=50) ada_boost.fit(X_train, y_train)
-
モデルの評価と予測: テストセットを使用してモデルの性能を評価し、予測結果を取得します。以下のコードは、テストセットでの正解率を計算する例です。
y_pred = ada_boost.predict(X_test) accuracy = accuracy_score(y_test, y_pred)
-
特徴量の重要度の確認: AdaBoostは、各特徴量の重要度を計算することもできます。以下のコードは、各特徴量の重要度を表示する例です。
feature_importance = ada_boost.feature_importances_ print(feature_importance)
以上が、PythonでのAdaBoostの実装と活用方法の概要です。適用するデータセットやモデルのパラメータによって結果は異なりますので、適宜調整してください。より詳細な情報や応用例については、scikit-learnの公式ドキュメントを参照してください。