부트스트랩 테스트는 통계를 반복적으로 샘플링하고 계산하여 샘플 통계적 차이의 통계적 유의성을 평가하는 비모수적 테스트 방법입니다. 단계는 다음과 같습니다. 1. 반복 샘플링 2. 각 샘플의 통계 계산 3. 통계의 샘플링 분포 생성 4. 원래 통계의 p-값 계산 5. p-값을 기반으로 결론 도출 .
부트스트랩 검사
부트스트랩 검사란 무엇입니까?
부트스트랩 테스트는 표본 통계의 차이가 통계적으로 유의한지 여부를 평가하는 데 사용되는 비모수 테스트 방법입니다. 원본 데이터 세트에서 반복적으로 샘플링하고 각 샘플에 대한 통계를 계산하여 통계의 샘플링 분포를 추정합니다.
부트스트랩 테스트 단계
-
원본 데이터 세트에서 샘플링 반복: 복원 샘플링을 통해 원본 데이터 세트에서 여러 샘플을 무작위로 선택합니다.
-
각 표본에 대한 통계 계산: 추출된 각 표본에 대해 평균, 중앙값 또는 차이와 같은 관심 통계를 계산합니다.
-
통계의 샘플링 분포 만들기: 반복 샘플링으로 계산된 모든 통계를 수집하고 해당 분포의 히스토그램을 만듭니다.
-
원래 통계의 p-값 계산: 원본 데이터 세트에서 계산된 통계를 샘플링 분포와 비교합니다. p-값은 원래 통계량이 표본 분포의 맨 끝 부분에 속할 확률입니다.
-
결론: p값이 미리 설정된 유의 수준(일반적으로 0.05)보다 작으면 표본 통계의 차이가 통계적으로 유의하다는 귀무가설을 기각합니다.
부트스트랩 테스트의 장점
- 데이터 분포에 대한 가정이 필요 없음
- 소규모 샘플 데이터에 대한 신뢰성이 높음
- 다양한 통계 평가에 사용할 수 있음
부트스트랩 테스트의 단점
- 특히 대규모 데이터 세트의 경우 계산 집약적일 수 있음
- 심하게 치우친 데이터나 이상값이 있는 데이터의 경우 정확도가 떨어질 수 있음
- 분산 또는 표준 편차와 같은 매개변수를 평가하는 데 사용할 수 없음
위 내용은 부트스트랩 테스트를 수행하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!