통계는 데이터를 분석하고 이해할 수 있는 강력한 도구를 제공합니다. 통계의 기본 개념 중 하나는 경험 법칙 또는 3시그마 법칙이라고도 알려진 68-95-99.7 규칙입니다. 이 규칙을 사용하면 표준 편차를 기반으로 데이터 분포에 대해 중요한 추론을 할 수 있습니다. 이 블로그 게시물에서는 68-95-99.7 규칙을 살펴보고 Python을 사용하여 이를 적용하는 방법을 보여줍니다.
68-95-99.7 규칙은 평균에서 특정 표준 편차 내에 있는 정규 분포의 데이터 비율을 추정하는 방법을 제공합니다. 이 규칙에 따르면 -
데이터의 약 68%가 평균의 1표준편차 내에 속합니다.
데이터의 약 95%가 평균의 2표준편차 내에 속합니다.
데이터의 약 99.7%가 평균의 3 표준편차 내에 속합니다.
이 백분율은 정규 분포(종형 곡선이라고도 함)를 따르는 데이터 세트에 대한 것입니다. 이 규칙을 이해하면 데이터의 확산을 신속하게 평가하고 특이치 또는 비정상적인 관찰을 식별할 수 있습니다.
68-95-99.7 규칙이 실제로 실행되는 모습을 보여주기 위해 Python과 인기 있는 데이터 분석 라이브러리 NumPy를 사용하겠습니다. NumPy는 필요한 값을 계산하는 데 도움이 되는 효율적인 수치 연산과 통계 기능을 제공합니다. 먼저 필요한 라이브러리를 가져오겠습니다 −
으아아아다음으로 numpy.random.normal() 함수를 사용하여 정규 분포를 따르는 무작위 데이터 세트를 생성하겠습니다. 평균 0과 표준편차 1을 사용하겠습니다 −
으아아아이제 데이터 세트의 평균과 표준편차를 계산할 수 있습니다 −
으아아아68-95-99.7 규칙이 적용되는 데이터와 영역을 시각화하기 위해 matplotlib.pyplot.hist() 함수를 사용하여 히스토그램을 만들 수 있습니다 −
으아아아생성된 히스토그램은 점선으로 표시된 평균 및 표준 편차와 함께 데이터 분포를 표시합니다.
각 범위에 포함되는 백분율을 계산하려면 정규 분포의 누적 분포 함수(CDF)를 사용할 수 있습니다. NumPy 함수 numpy.random.normal()은 정규 분포 데이터를 생성하지만 NumPy는 CDF를 계산하기 위해 numpy.random.normal()도 제공합니다 −
으아아아이 코드를 실행하면 평균의 1, 2, 3 표준편차 내에 속하는 데이터의 비율이 표시됩니다.
으아아아이러한 결과는 68-95-99.7 규칙의 예상 비율과 매우 일치합니다.
각 범위에 포함되는 백분율에는 특정한 해석이 있습니다. 평균의 1 표준편차 내에 속하는 데이터는 상대적으로 흔한 반면, 평균의 3 표준편차를 벗어나는 데이터는 드문 것으로 간주됩니다. 이러한 설명을 이해하면 데이터에 대해 의미 있는 추론을 하는 데 도움이 됩니다.
68-95-99.7 규칙은 귀중한 지침이지만 정규 분포에서 크게 벗어나는 데이터 세트에는 정확하게 적용되지 않을 수 있습니다. 이러한 데이터 세트로 작업할 때는 다른 통계 기법을 고려하고 추가 분석을 수행하는 것이 중요합니다.
이상값은 각 범위에 포함되는 백분율의 정확도에 큰 영향을 미칠 수 있습니다. 이러한 극단값은 분포를 왜곡하고 규칙의 효율성에 영향을 미칠 수 있습니다. 정확한 통계 분석을 위해서는 이상값을 적절하게 식별하고 처리하는 것이 중요합니다.
68-95-99.7 규칙은 모든 영역에 적용됩니다. 예를 들어, 품질 관리 프로세스에서 결함이 있는 제품을 식별하고, 재무 분석에서 위험 및 투자 수익을 평가하고, 의료 연구에서 환자 특성을 이해하고, 기타 여러 영역에서 데이터 분포를 이해하는 데 매우 중요합니다.
통계를 더 깊이 파고들면서 68-95-99.7 규칙을 보완하는 다른 개념을 탐색해 보세요. 왜도, 첨도, 신뢰 구간, 가설 검정, 회귀 분석은 데이터에 대한 이해와 분석을 더욱 향상시킬 수 있는 통계 도구의 몇 가지 예에 불과합니다.
68-95-99.7 규칙은 표준 편차 측면에서 데이터 분포를 이해할 수 있게 해주는 통계의 강력한 개념입니다. 이 규칙을 적용하면 평균을 중심으로 특정 범위에 속하는 데이터의 비율을 추정할 수 있습니다. 이 블로그에서는 Python과 NumPy 라이브러리를 사용하여 임의의 데이터 세트를 생성하고 시각화하고 각 범위의 백분율 적용 범위를 계산합니다. 이 규칙을 이해하면 데이터에 대해 의미 있는 추론을 할 수 있고 잠재적인 특이점이나 비정상적인 관찰을 식별할 수 있습니다.
위 내용은 Python을 사용하여 통계에서 68-95-99.7 규칙 시연의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!