まず、必要なライブラリをインポートします。
from sklearn.model_selection import GridSearchCV
from sklearn.feature_selection import SelectKBest, f_regression
from sklearn.linear_model import LinearRegression
次に、データセットを読み込み、特徴量とターゲット変数を準備します。
# データの読み込み
X = データの特徴量
y = ターゲット変数
GridSearchCVのパラメータグリッドを定義します。ここでは、特徴量の数を変化させてテストします。
次に、特徴量選択器と予測モデルを定義します。
# 特徴量選択器
feature_selector = SelectKBest(f_regression)
# 予測モデル
model = LinearRegression()
GridSearchCVを設定します。
# GridSearchCVの設定
grid_search = GridSearchCV(estimator=model, param_grid=param_grid, scoring='r2')
最後に、GridSearchCVを実行し、最適な特徴量の数を取得します。
# GridSearchCVの実行
grid_search.fit(X, y)
# 最適な特徴量の数を取得
best_features = grid_search.best_params_['k']
これで、GridSearchCVを使用してトップの特徴量を取得することができます。best_featuresには、最適な特徴量の数が格納されます。
この方法を使って、機械学習モデルのパフォーマンスを向上させるために特徴量選択を行うことができます。また、GridSearchCVを使用することで、最適な特徴量の数を自動的に見つけることができます。
以上が、GridSearchCVを使用してトップの特徴量を取得する方法です。この方法を使って、効果的な特徴量選択を行い、モデルのパフォーマンスを向上させることができます。