PythonでのLasso回帰の使い方


Lasso回帰をPythonで使用するためには、scikit-learnライブラリをインストールする必要があります。以下に、Lasso回帰を使うための基本的な手順とコード例を示します。

まず、scikit-learnをインストールします。以下のコマンドを使用します。

pip install scikit-learn

次に、必要なライブラリをインポートします。

from sklearn.linear_model import Lasso
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

次に、データセットを読み込みます。ここでは、scikit-learnに組み込まれているボストン住宅価格のデータセットを使用します。

boston = load_boston()
X, y = boston.data, boston.target

データセットを訓練データとテストデータに分割します。

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

Lasso回帰モデルを作成し、訓練データで学習させます。

lasso = Lasso(alpha=0.1)
lasso.fit(X_train, y_train)

学習したモデルを使って予測を行います。

y_pred = lasso.predict(X_test)

予測結果の評価には、平均二乗誤差(Mean Squared Error, MSE)を使用することが一般的です。

mse = mean_squared_error(y_test, y_pred)
print("Mean Squared Error:", mse)

以上が、PythonでLasso回帰を使う基本的な手順とコード例です。Lasso回帰は、特徴選択やモデルの正則化に有用であり、データセットに対して適切な正則化パラメータを選択することが重要です。さまざまなalpha(正則化パラメータ)の値を試して、モデルのパフォーマンスを検証してみてください。