Education, study and knowledge

Test chi-kwadrat (χ²): co to jest i jak jest wykorzystywany w statystyce

W statystyce istnieją różne testy do analizy relacji między zmiennymi. Zmienne nominalne to takie, które pozwalają na relacje równości i nierówności, takie jak płeć.

W tym artykule poznamy jeden z testów do analizy niezależności pomiędzy zmiennymi nominalnymi lub wyższymi: test chi-kwadrat poprzez testowanie hipotez hypo (Testy dobroci dopasowania).

  • Powiązany artykuł: „Analiza wariancji (ANOVA): co to jest i jak jest wykorzystywana w statystyce"

Co to jest test chi-kwadrat?

Test chi-kwadrat, zwany także chi-kwadrat (Χ2), należy do testów odnoszących się do statystyki opisowej, w szczególności statystyki opisowej stosowanej do badania dwóch zmiennych. Z kolei statystyki opisowe skupiają się na wydobywaniu informacji o próbie. Zamiast tego statystyki inferencyjne wydobywają informacje o populacji.

Nazwa testu jest typowa dla rozkładu chi-kwadrat prawdopodobieństwa, na którym jest oparty. Ten test został opracowany w 1900 roku przez Karla Pearsona.

Test chi-kwadrat jest jednym z najbardziej znanych i służy do analizy zmiennych nominalnych lub jakościowych, czyli do określenia istnienia lub braku niezależności między dwiema zmiennymi. To, że dwie zmienne są niezależne, oznacza, że ​​nie mają związku, a zatem jedna nie zależy od drugiej ani odwrotnie.

instagram story viewer

Zatem wraz z badaniem niezależności powstaje również metoda weryfikacji, czy liczności obserwowane w każdej kategorii są zgodne z niezależnością między obiema zmiennymi.

Jak uzyskuje się niezależność między zmiennymi?

Aby ocenić niezależność między zmiennymi, wyliczane są wartości, które wskazywałyby na niezależność bezwzględną, czyli tzw. „częstotliwości oczekiwane”, porównując je z częstotliwościami próbek.

Jak zwykle hipoteza zerowa (H0) wskazuje, że obie zmienne są niezależne, podczas gdy hipoteza alternatywna (H1) wskazuje, że zmienne mają pewien stopień powiązania lub związku.

Korelacja między zmiennymi

Tak więc, podobnie jak inne testy do tego samego celu, test chi-kwadrat służy do dostrzeżenia sensu korelacji między dwiema zmiennymi nominalnymi lub na wyższym poziomie (Na przykład możemy to zastosować, jeśli chcemy wiedzieć, czy istnieje związek między seksem [bycie mężczyzną lub kobietą] a obecnością lęku [tak lub nie]).

Aby określić tego typu zależność, należy zapoznać się z tabelą częstości (również w przypadku innych testów, takich jak współczynnik Yule Q).

Jeżeli liczności empiryczne i teoretyczne lub oczekiwane są zbieżne, to nie ma związku między zmiennymi, czyli są one niezależne. Z drugiej strony, jeśli się pokrywają, nie są niezależne (istnieje zależność między zmiennymi, na przykład między X i Y).

Rozważania

Test chi-kwadrat, w przeciwieństwie do innych testów, nie ustanawia ograniczeń liczby modalności przypadających na zmienne, a liczba wierszy i liczba kolumn w tabelach nie muszą się zgadzać.

Jednak konieczne jest zastosowanie go do badań opartych na niezależnych próbach i gdy wszystkie oczekiwane wartości są większe niż 5. Jak już wspomnieliśmy, oczekiwane wartości to takie, które wskazują na absolutną niezależność obu zmiennych.

Ponadto, aby użyć testu chi-kwadrat, poziom pomiaru musi być nominalny lub wyższy. Nie ma górnej granicy, czyli nie pozwala nam poznać intensywności korelacji. Innymi słowy, chi-kwadrat przyjmuje wartości od 0 do nieskończoności.

Z drugiej strony, jeśli próba się zwiększa, wzrasta wartość chi-kwadrat, ale musimy być ostrożni w jej interpretacji, ponieważ nie oznacza to większej korelacji.

Rozkład chi-kwadrat

Test chi-kwadrat wykorzystuje przybliżenie do rozkładu chi-kwadrat aby ocenić prawdopodobieństwo wystąpienia rozbieżności równej lub większej niż ta istniejąca między danymi a oczekiwanymi częstotliwościami zgodnie z hipotezą zerową.

Dokładność tej oceny będzie zależeć od tego, czy oczekiwane wartości nie są bardzo małe, a w mniejszym stopniu, czy kontrast między nimi nie jest bardzo duży.

Korekta Yatesa

Korekta Yatesa to wzór matematyczny stosowany z tabelami 2x2 i z niewielką teoretyczną częstotliwością (mniej niż 10), aby poprawić ewentualne błędy testu chi-kwadrat.

Generalnie stosuje się korekcję Yatesa lub „korektę ciągłości”. gdy zmienna dyskretna aproksymuje rozkład ciągły.

Kontrast hipotezy

Ponadto test chi-kwadrat należy do tzw. testów dopasowania lub kontrastów contrast, które mają na celu rozstrzygnięcie, czy hipoteza, że ​​dana próba pochodzi z populacji o w pełni określonym rozkładzie prawdopodobieństwa w hipotezie zerowej, może być zaakceptowana.

Kontrasty opierają się na porównaniu obserwowanych częstotliwości (częstotliwości empirycznych) w próbka z tymi, które byłyby oczekiwane (częstotliwościami teoretycznymi lub oczekiwanymi), gdyby hipoteza zerowa była prawdziwe. A) Tak, hipoteza zerowa zostaje odrzucona jeśli istnieje znacząca różnica między częstotliwościami obserwowanymi i oczekiwanymi.

Funkcjonowanie

Jak widzieliśmy, test chi-kwadrat jest używany z danymi należącymi do skali nominalnej lub wyższej. Na podstawie chi-kwadrat ustalana jest hipoteza zerowa, która postuluje rozkład prawdopodobieństwa określony jako model matematyczny populacji, która wygenerowała próbkę.

Gdy mamy hipotezę, musimy wykonać kontrast i, w tym celu mamy dane w tabeli częstotliwości. Bezwzględna obserwowana lub empiryczna częstotliwość jest wskazana dla każdej wartości lub zakresu wartości. Następnie, zakładając, że hipoteza zerowa jest prawdziwa, dla każdej wartości lub przedziału wartości obliczana jest bezwzględna częstotliwość, która byłaby oczekiwana lub oczekiwana częstotliwość.

Interpretacja

Statystyka chi-kwadrat przyjmie wartość równą 0, jeśli istnieje doskonała zgodność między częstotliwościami obserwowanymi i oczekiwanymi; przez minusy, statystyka przyjmie dużą wartość, jeśli istnieje duża rozbieżność między tymi częstotliwościami, a w konsekwencji hipoteza zerowa musi zostać odrzucona.

Odniesienia bibliograficzne:

  • Lubin, P. Macia, A. Rubio de Lerma, P. (2005). Psychologia matematyczna I i II. Madryt: UNED.
  • Pardo, A. San Martín, R. (2006). Analiza danych w psychologii II. Madryt: Piramida.

Ergonomia: co to jest i jakie są jego 4 rodzaje i funkcje

Wyobraź sobie, że pracujemy w biurze osiem godzin dziennie przed komputerem, ale ta firma umieszc...

Czytaj więcej

Cohousing (cohousing): co to jest i jaki styl życia proponuje?

Żyjemy w społeczeństwie, które z upływem czasu staje się coraz bardziej indywidualistyczne, przyn...

Czytaj więcej

6 dziwnych wad ludzkiego ciała

Wiele mówi się o twierdzeniach, że ludzkie ciało jest doskonale zaprojektowane, że nasz gatunek p...

Czytaj więcej