-
中央値の信頼区間の計算方法:
- 中央値の信頼区間は、非パラメトリックな手法を使用して推定することが一般的です。一つの方法として、ブートストラップ法を使用します。
-
ブートストラップ法による中央値の信頼区間の計算:
- ブートストラップ法は、サンプルから復元抽出を行い、再サンプリングを繰り返すことで中央値の分布を推定します。以下にPythonのコード例を示します。
import numpy as np
def bootstrap_confidence_interval(data, statistic, alpha, n_bootstrap):
n = len(data)
bootstrap_samples = np.random.choice(data, size=(n_bootstrap, n), replace=True)
bootstrap_statistics = np.apply_along_axis(statistic, axis=1, arr=bootstrap_samples)
lower_percentile = (1.0 - alpha) / 2.0
upper_percentile = 1.0 - lower_percentile
lower_bound = np.percentile(bootstrap_statistics, lower_percentile * 100)
upper_bound = np.percentile(bootstrap_statistics, upper_percentile * 100)
return lower_bound, upper_bound
# データの例
data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
# 中央値の計算関数
def median(data):
return np.median(data)
# 中央値の信頼区間の計算
alpha = 0.05 # 95%信頼区間
n_bootstrap = 1000 # ブートストラップサンプル数
lower_bound, upper_bound = bootstrap_confidence_interval(data, median, alpha, n_bootstrap)
print("中央値の信頼区間: [{:.2f}, {:.2f}]".format(lower_bound, upper_bound))
上記のコードでは、bootstrap_confidence_interval
関数を使用してデータから中央値の信頼区間を計算しています。data
はデータのリスト、statistic
は統計量を計算する関数(ここではmedian
関数)、alpha
は信頼レベル、n_bootstrap
はブートストラップサンプルの数です。計算結果はlower_bound
とupper_bound
として返されます。