Education, study and knowledge

카이제곱 검정(χ²): 정의 및 통계에서 사용되는 방법

통계에는 변수 간의 관계를 분석하기 위한 다양한 테스트가 있습니다. 명목변수는 성별과 같이 평등과 불평등의 관계를 허용하는 변수입니다.

이 기사에서는 명목 또는 상위 변수 간의 독립성을 분석하기 위한 테스트 중 하나에 대해 알아볼 것입니다. 카이제곱 검정, 가설 검정을 통해 (적합도 테스트).

  • 관련 기사: "분산 분석(ANOVA): 이것이 무엇이며 통계에서 어떻게 사용되는지"

카이제곱 검정이란?

카이제곱 검정(Χ2)이라고도 함, 기술 통계, 특히 두 변수의 연구에 적용된 기술 통계와 관련된 테스트 내에 있습니다. 기술 통계는 표본에 대한 정보를 추출하는 데 중점을 둡니다. 대신 추론 통계는 모집단에 대한 정보를 추출합니다.

테스트 이름은 기반이 되는 확률의 카이제곱 분포의 전형입니다. 이 테스트 1900년 칼 피어슨이 개발한.

카이제곱 검정은 명목 또는 질적 변수를 분석하는 데 사용되는 가장 잘 알려진 방법 중 하나입니다. 즉, 두 변수 간의 독립성 여부를 판별하는 데 사용됩니다. 두 변수가 독립적이라는 것은 관계가 없고 따라서 하나가 다른 변수에 의존하지 않으며 그 반대도 마찬가지임을 의미합니다.

따라서 독립성 연구와 함께 각 범주에서 관찰된 빈도가 두 변수 간의 독립성과 양립할 수 있는지 확인하는 방법도 시작되었습니다.

변수 간의 독립성은 어떻게 얻습니까?

변수 간의 독립성을 평가하기 위해 절대 독립성을 나타내는 값을 계산하는데, 이를 "기대 빈도"라고 합니다. 샘플 주파수와 비교.

평소와 같이 귀무 가설(H0)은 두 변수가 모두 독립적임을 나타내고 대립 가설(H1)은 변수가 어느 정도 연관되거나 관계가 있음을 나타냅니다.

변수 간의 상관관계

따라서 동일한 목적에 대한 다른 검정과 마찬가지로 카이-제곱 검정 두 명목 변수 또는 더 높은 수준의 상관 관계의 의미를 보는 데 사용됩니다. (예를 들어, 섹스[남자인지 여자인지]와 불안의 존재[예 또는 아니오] 사이에 관계가 있는지 알고 싶을 때 적용할 수 있습니다.

이러한 유형의 관계를 결정하기 위해 참조할 빈도 테이블이 있습니다(Yule Q 계수와 같은 다른 테스트에도 해당).

instagram story viewer

경험적 빈도와 이론적 또는 예상 빈도가 일치하면 변수 간에 관계가 없습니다. 즉, 독립입니다. 반면에 일치하는 경우 독립적이지 않습니다(예: X와 Y 사이에 변수 간에 관계가 있음).

고려 사항

카이제곱 검정은 다른 검정과 달리 변수당 양식 수에 대한 제한을 설정하지 않으며, 테이블의 행 수와 열 수는 일치하지 않아도 됩니다..

다만, 독립표본에 기초한 연구와 모든 기대값이 5보다 큰 경우에 적용할 필요가 있다. 이미 언급했듯이 예상 값은 두 변수 간의 절대적인 독립성을 나타내는 값입니다.

또한 카이제곱 검정을 사용하려면 측정 수준이 명목상 이상이어야 합니다. 상한선이 없습니다. 즉, 상관관계의 강도를 알 수 없습니다.. 즉, 카이제곱은 0에서 무한대 사이의 값을 취합니다.

반면에 표본이 증가하면 카이제곱 값이 증가하지만, 그렇다고 해서 상관관계가 더 많다는 의미는 아니기 때문에 해석에 주의가 필요합니다.

카이제곱 분포

카이제곱 검정 카이 제곱 분포에 대한 근사값을 사용합니다. 귀무 가설에 따라 데이터와 예상 빈도 사이에 존재하는 불일치 이상의 확률을 평가합니다.

이 평가의 정확도는 예상 값이 매우 작지 않은지 여부와 그 사이의 대비가 그다지 높지 않은 정도에 따라 다릅니다.

예이츠 수정

예이츠의 수정은 2x2 테이블과 작은 이론적 빈도로 적용되는 수학 공식 (10 미만), 카이-제곱 검정의 가능한 오류를 수정합니다.

일반적으로 Yates 보정 또는 "연속성 보정"이 적용됩니다. 이산 변수가 연속 분포를 근사할 때.

가설 대조

또한 카이제곱 검정은 소위 적합도 테스트 또는 대조에 속합니다., 이는 주어진 표본이 귀무 가설에서 완전히 지정된 확률 분포를 가진 모집단에서 나왔다는 가설이 받아들여질 수 있는지 여부를 결정하는 목적을 가지고 있습니다.

대조는 관찰된 빈도(경험적 빈도)의 비교를 기반으로 합니다. 귀무 가설이 진실. 답) 네, 귀무가설은 기각된다 관찰된 빈도와 예상 빈도 사이에 상당한 차이가 있는 경우.

작동

지금까지 살펴본 바와 같이 카이제곱 검정은 명목 척도 이상에 속하는 데이터에 사용됩니다. 카이제곱에서 표본을 생성한 모집단의 수학적 모델로 지정된 확률 분포를 가정하는 귀무 가설이 설정됩니다.

일단 가설이 있으면 대조를 수행해야 하며, 이를 위해 빈도 테이블에 데이터가 있습니다.. 각 값 또는 값 범위에 대해 절대 관찰 또는 경험적 빈도가 표시됩니다. 그런 다음 귀무 가설이 참이라고 가정하고 각 값 또는 값의 간격에 대해 예상되는 절대 빈도 또는 예상 빈도가 계산됩니다.

해석

카이제곱 통계량은 관찰된 빈도와 예상 빈도 사이에 완벽한 일치가 있는 경우 0과 같은 값을 취합니다. 단점으로, 이러한 빈도 사이에 큰 불일치가 있는 경우 통계는 큰 값을 취합니다., 따라서 귀무가설을 기각해야 합니다.

참고 문헌:

  • 루빈, P. 마시아, A. 루비오 데 레르마, P. (2005). 수학적 심리학 I 및 II. 마드리드: UNED.
  • 파르도, A. 산 마틴, R. (2006). 심리학의 데이터 분석 II. 마드리드: 피라미드.
North Sentinelese: 세계에서 가장 고립된 부족

North Sentinelese: 세계에서 가장 고립된 부족

우리는 현대화되고 세계화된 사회에 살고 있습니다. 이 문제에 대한 의견을 떠나 세계화 시대에 다른 문화와의 접촉은 추구하는 것입니다 대다수의 인구에 의해 지속적으로 아이디어...

더 읽어보기

과학과 철학의 6가지 차이점

과학과 철학은 종종 혼동되는 지식 창출의 두 영역입니다. 서로.철학자와 과학자는 종종 단순히 모든 것의 전문가로 간주됩니다. 모든 주제에 대한 지적 권한이며 이는 기능 사이에...

더 읽어보기

지속 가능한 것과 지속 가능한 것의 4가지 차이점

우리는 매우 다양한 자원이 있는 세상에 살고 있지만, 인간은 점점 더 많은 자원을 착취하고 있습니다. 그러한 착취가 결국 자연에 피해를 줄 수 있는지 또는 이러한 자원이 마모...

더 읽어보기