부트스트랩 신뢰 구간:
전체 분포 F를 알 수 없지만 분포 F에서 n의 용량을 갖는 데이터 샘플이 있다고 가정합니다. 이 샘플에서 용량이 n인 샘플이 추출됩니다. 표본추출법을 사용하여 이러한 종류의 표본을 부트스트랩 표본이라고 합니다. 원래 표본에서 많은 부트스트랩 표본을 연속적이고 독립적으로 추출하고 이 표본을 사용하여 모집단 F에 대한 통계적 추론을 만듭니다. 이 방법을 비모수적 부트스트랩 방법이라고 하며 부트스트랩 방법이라고도 합니다.
부트스트랩 방법을 사용하면 변수(매개변수)의 신뢰구간을 구할 수 있는데 이를 부트스트랩 신뢰구간이라고 합니다.
부트스트랩 신뢰 구간:
Python을 사용하여 부트스트랩 신뢰 구간을 계산합니다.
여기서 1차원 데이터를 예로 들어 표본 평균을 표본 추정량으로 사용합니다. 코드는 다음과 같습니다:
import numpy as np def average(data): return sum(data) / len(data) def bootstrap(data, B, c, func): """ 计算bootstrap置信区间 :param data: array 保存样本数据 :param B: 抽样次数 通常B>=1000 :param c: 置信水平 :param func: 样本估计量 :return: bootstrap置信区间上下限 """ array = np.array(data) n = len(array) sample_result_arr = [] for i in range(B): index_arr = np.random.randint(0, n, size=n) data_sample = array[index_arr] sample_result = func(data_sample) sample_result_arr.append(sample_result) a = 1 - c k1 = int(B * a / 2) k2 = int(B * (1 - a / 2)) auc_sample_arr_sorted = sorted(sample_result_arr) lower = auc_sample_arr_sorted[k1] higher = auc_sample_arr_sorted[k2] return lower, higher if __name__ == '__main__': result = bootstrap(np.random.randint(0, 50, 50), 1000, 0.95, average) print(result)
출력:
(20.48, 28.32)
위 내용은 부트스트랩 신뢰 구간을 찾는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!