Pythonにおける標準化の方法


  1. NumPyを使用した標準化の方法:

    import numpy as np
    data = np.array([1, 2, 3, 4, 5])
    # 平均と標準偏差を計算
    mean = np.mean(data)
    std = np.std(data)
    # データの標準化
    standardized_data = (data - mean) / std
    print(standardized_data)
  2. scikit-learnを使用した標準化の方法:

    from sklearn.preprocessing import StandardScaler
    data = [[1, 2], [3, 4], [5, 6]]
    # StandardScalerオブジェクトを作成
    scaler = StandardScaler()
    # データを標準化
    standardized_data = scaler.fit_transform(data)
    print(standardized_data)
  3. pandasを使用した標準化の方法:

    import pandas as pd
    data = {'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]}
    # DataFrameを作成
    df = pd.DataFrame(data)
    # 列ごとにデータを標準化
    standardized_data = (df - df.mean()) / df.std()
    print(standardized_data)

これらのコード例では、NumPy、scikit-learn、およびpandasを使用してデータの標準化を行っています。どの方法を選択するかは、データの形式や処理のニーズによって異なります。適切な方法を選び、データのスケールを統一化することで、より正確な分析やモデリングを行うことができます。