Pythonを使用した中央値の信頼区間の計算方法


  1. 中央値の信頼区間の計算方法:

    • 中央値の信頼区間は、非パラメトリックな手法を使用して推定することが一般的です。一つの方法として、ブートストラップ法を使用します。
  2. ブートストラップ法による中央値の信頼区間の計算:

    • ブートストラップ法は、サンプルから復元抽出を行い、再サンプリングを繰り返すことで中央値の分布を推定します。以下にPythonのコード例を示します。
import numpy as np
def bootstrap_confidence_interval(data, statistic, alpha, n_bootstrap):
    n = len(data)
    bootstrap_samples = np.random.choice(data, size=(n_bootstrap, n), replace=True)
    bootstrap_statistics = np.apply_along_axis(statistic, axis=1, arr=bootstrap_samples)
    lower_percentile = (1.0 - alpha) / 2.0
    upper_percentile = 1.0 - lower_percentile
    lower_bound = np.percentile(bootstrap_statistics, lower_percentile * 100)
    upper_bound = np.percentile(bootstrap_statistics, upper_percentile * 100)
    return lower_bound, upper_bound
# データの例
data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
# 中央値の計算関数
def median(data):
    return np.median(data)
# 中央値の信頼区間の計算
alpha = 0.05  # 95%信頼区間
n_bootstrap = 1000  # ブートストラップサンプル数
lower_bound, upper_bound = bootstrap_confidence_interval(data, median, alpha, n_bootstrap)
print("中央値の信頼区間: [{:.2f}, {:.2f}]".format(lower_bound, upper_bound))

上記のコードでは、bootstrap_confidence_interval関数を使用してデータから中央値の信頼区間を計算しています。dataはデータのリスト、statisticは統計量を計算する関数(ここではmedian関数)、alphaは信頼レベル、n_bootstrapはブートストラップサンプルの数です。計算結果はlower_boundupper_boundとして返されます。