Kolmogorov-Smirnov 테스트: 그것이 무엇이며 통계에서 어떻게 사용됩니까?
통계에서는 파라메트릭 및 비모수 테스트가 잘 알려져 있고 사용됩니다. 널리 사용되는 비모수 테스트는 Kolmogorov-Smirnov 테스트입니다., 샘플 점수가 정규 분포를 따르는지 여부를 확인할 수 있습니다.
소위 적합도 테스트 그룹에 속합니다. 이 기사에서 우리는 그 특성, 용도 및 적용 방법을 알 것입니다.
- 관련 기사: "카이 제곱(χ²) 테스트: 정의 및 통계에서 사용되는 방법"
비모수 테스트
Kolmogorov-Smirnov 테스트는 다음과 같습니다. 비모수 테스트의 일종. 비모수 검정(자유 분포라고도 함)은 추론 통계에 사용되며 다음과 같은 특징이 있습니다.
- 그들은 적합도, 독립성에 대한 가설을 제안합니다...
- 변수의 측정 수준이 낮습니다(서수).
- 과도한 제한이 없습니다.
- 작은 샘플에 적용할 수 있습니다.
- 견고합니다.
Kolmogorov-Smirnov 테스트: 특성
Kolmogórov-Smirnov 테스트는 통계에 속하는 자체 테스트 중 하나입니다. 추론 통계. 추론 통계는 모집단에 대한 정보를 추출하는 것을 목표로 합니다.
이것은 적합도 테스트즉, 표본에서 얻은 점수가 정규 분포를 따르는지 여부를 확인하는 데 사용됩니다. 즉, 데이터 세트의 분포와 특정 이론적 분포 사이의 일치 정도를 측정할 수 있습니다. 그 목적은 데이터가 지정된 이론적 분포, 즉 즉, 관찰이 분포에서 합리적으로 나올 수 있는지 여부를 테스트하는 것입니다. 지정된.
Kolmogorov-Smirnov 테스트는 다음 질문을 다룹니다. 표본 관측치가 일부 가설 분포에서 나온 것입니까?
귀무가설과 대립가설
적합도 테스트로서 "(경험적) 샘플링 분포가 (이론적) 모집단 분포에 적합합니까?"라는 질문에 답합니다. 이 경우, 귀무 가설(H0)은 경험적 분포가 이론적 분포와 유사하다는 것을 확립합니다. (귀무가설은 기각되지 않는 가설이다.) 즉, 귀무 가설은 관찰된 빈도 분포가 이론적 분포와 일치(따라서 적합)하다는 것을 확립합니다.
대조적으로, 대립가설(H1)은 관찰된 빈도 분포가 이론적 분포와 일치하지 않는다는 것입니다(잘못된 적합도). 다른 가설 대비 테스트와 마찬가지로 기호 α(알파)는 테스트의 유의 수준을 나타냅니다.
- 다음 항목에 관심이 있을 수 있습니다. "Pearson의 상관 계수: 정의 및 사용 방법"
어떻게 계산됩니까?
Kolmogorov-Smirnov 테스트의 결과는 문자 Z로 표시됩니다. Z는 가장 큰 차이(절대값)에서 계산됩니다. 이론적 및 관측된(경험적) 누적 분포 함수 사이.
가정
Kolmogorov-Smirnov 테스트를 올바르게 적용하려면 일련의 가정을 해야 합니다. 먼저, 테스트 검정 분포의 매개변수가 이전에 지정되었다고 가정합니다.. 이 절차는 샘플에서 매개변수를 추정합니다.
반면에, 표본 평균과 표준 편차는 정규 분포의 매개변수입니다., 표본의 최소값과 최대값은 균일 분포의 범위를 정의하고 표본 평균은 포아송 분포의 매개변수이고 표본 평균은 분포의 매개변수입니다. 기하급수적.
Kolmogorov-Smirnov 검정이 가정된 분포로부터의 편차를 탐지하는 능력은 심각하게 감소될 수 있습니다. 추정된 매개변수가 있는 정규 분포와 대조하기 위해 K-S Lillliefors 테스트를 사용할 가능성을 고려해야 합니다..
애플리케이션
Kolmogorov-Smirnov 테스트는 변수(예: 학업 성적 또는 € 수입)가 정상적으로 분포되어 있는지 확인하기 위해 샘플에 적용할 수 있습니다. 많은 파라메트릭 테스트에서 사용하는 변수가 정규 분포를 따르도록 요구하기 때문에 이를 알아야 하는 경우가 있습니다.
장점
일부 Kolmogorov-Smirnov 테스트의 장점 이다:
- 카이제곱(χ²) 검정(적합도 검정이기도 함)보다 강력합니다.
- 계산 및 사용이 쉽고 데이터를 그룹화할 필요가 없습니다.
- 통계는 예상 빈도 분포와 무관하며 샘플 크기에만 의존합니다.
파라메트릭 테스트와의 차이점
Kolmogorov-Smirnov 테스트와 같은 비모수 테스트와 달리 파라메트릭 테스트에는 다음과 같은 특징이 있습니다.
- 매개변수에 대한 가설을 세웁니다.
- 변수의 측정 수준은 최소한 정량적입니다.
- 충족되어야 하는 여러 가지 가정이 있습니다.
- 그들은 정보를 잃지 않습니다.
- 그들은 높은 통계적 힘을 가지고 있습니다.
파라메트릭 테스트의 몇 가지 예 평균 차이에 대한 t-테스트 또는 ANOVA입니다.