-
NumPyを使用した標準化の方法:
import numpy as np data = np.array([1, 2, 3, 4, 5]) # 平均と標準偏差を計算 mean = np.mean(data) std = np.std(data) # データの標準化 standardized_data = (data - mean) / std print(standardized_data)
-
scikit-learnを使用した標準化の方法:
from sklearn.preprocessing import StandardScaler data = [[1, 2], [3, 4], [5, 6]] # StandardScalerオブジェクトを作成 scaler = StandardScaler() # データを標準化 standardized_data = scaler.fit_transform(data) print(standardized_data)
-
pandasを使用した標準化の方法:
import pandas as pd data = {'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]} # DataFrameを作成 df = pd.DataFrame(data) # 列ごとにデータを標準化 standardized_data = (df - df.mean()) / df.std() print(standardized_data)
これらのコード例では、NumPy、scikit-learn、およびpandasを使用してデータの標準化を行っています。どの方法を選択するかは、データの形式や処理のニーズによって異なります。適切な方法を選び、データのスケールを統一化することで、より正確な分析やモデリングを行うことができます。