부트스트랩 테스트는 샘플링과 통계 계산을 반복하여 샘플링 분포를 추정하고 통계적 유의성을 평가합니다. 단계에는 원본 데이터에서 교체를 통해 무작위로 샘플링하는 작업이 포함됩니다. 통계를 계산하고 여러 번 반복합니다. 부트스트랩 표본과 통계 표본 추출 분포를 만듭니다. 관찰된 통계 또는 더 극단적인 값에 속할 확률을 측정하는 P 값을 계산합니다. P 값이 작을수록 통계적 유의성은 높아집니다. P 값
Bootstrap 테스트
부트스트랩 테스트는 통계의 샘플링 분포를 평가하여 통계적으로 유의한지 여부를 확인하는 데 사용되는 통계 방법입니다. 부트스트랩 테스트 단계는 다음과 같습니다.
-
원본 데이터 세트에서 샘플 추출: 원본 데이터 세트에서 원본 데이터 세트 크기의 샘플을 무작위로 추출하여 교체합니다. 즉, 추출된 요소가 샘플에 반복적으로 나타날 수 있습니다.
-
통계 계산: 추출된 샘플에 대해 평균, 중앙값, 표준 편차 등 관심 있는 통계를 계산합니다.
-
1단계와 2단계 반복: 1단계와 2단계를 여러 번 반복하여 많은 샘플을 만들고 해당 통계를 계산합니다. 이러한 표본을 부트스트랩 표본이라고 하며, 계산된 통계를 부트스트랩 통계라고 합니다.
-
샘플링 분포 만들기: 부트스트랩 통계를 모아 샘플링 분포를 만듭니다. 표본분포는 표본 추출과 통계 계산을 여러 번 반복할 경우 통계가 어떻게 변하는지를 보여줍니다.
-
P-값 계산: P-값은 관찰된 통계 또는 더 극단적인 통계에 속할 확률입니다. P 값이 작을수록 관측된 통계가 무작위 샘플링에 의해 생성되었다는 의심이 커집니다.
P-값 설명
P-값은 통계적 유의성의 척도로 자주 사용됩니다. 일반적으로 허용되는 임계값에 따르면 P-값:
- P-값 은 통계적으로 유의미한 것으로 간주되며, 이는 관찰된 통계가 무작위 샘플링으로 인해 발생할 가능성이 없음을 나타냅니다.
- 0.05 유의성에 가까운 것으로 간주되지만 통계적 유의성을 명확하게 확인할 수는 없습니다.
-
P 값 >= 0.1: 은 유의미하지 않은 것으로 간주되며, 이는 관찰된 통계가 무작위 샘플링에 의해 생성될 수 있음을 나타냅니다.
부트스트랩 테스트는 샘플링 방법이며 그 결과는 부트스트랩 샘플에 따라 달라집니다. 따라서 부트스트랩 테스트는 항상 완전히 정확하지는 않지만 일반적으로 통계의 샘플링 분포에 대한 좋은 추정치를 제공할 수 있습니다.
위 내용은 부트스트랩 테스트를 읽는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!