Education, study and knowledge

Chi-square test (χ²): hva det er og hvordan det brukes i statistikk

I statistikken er det forskjellige tester for å analysere forholdet mellom variabler. Nominelle variabler er de som tillater forhold av likhet og ulikhet, for eksempel kjønn.

I denne artikkelen vil vi kjenne en av testene for å analysere uavhengigheten mellom nominelle eller høyere variabler: chi-kvadrat-testen, gjennom hypotesetesting (Tester av godhet av passform).

  • Relatert artikkel: "Analyse av varians (ANOVA): hva det er og hvordan det brukes i statistikk"

Hva er chi-square test?

Chi-kvadrat-testen, også kalt Chi-kvadrat (Χ2), er innenfor testene knyttet til beskrivende statistikk, spesielt beskrivende statistikk brukt på studiet av to variabler. Beskrivende statistikk fokuserer på sin side på å hente ut informasjon om prøven. Inferensiell statistikk trekker i stedet ut informasjon om befolkningen.

Testens navn er typisk for Chi-kvadratfordelingen av sannsynligheten den er basert på. Denne testen ble utviklet i 1900 av Karl Pearson.

Chi-kvadrat-testen er en av de mest kjente og brukes til å analysere nominelle eller kvalitative variabler, det vil si for å bestemme eksistensen eller ikke av uavhengighet mellom to variabler. At to variabler er uavhengige betyr at de ikke har noe forhold, og derfor er den ene ikke avhengig av den andre, og heller ikke omvendt.

instagram story viewer

Således, med studiet av uavhengighet, oppstår også en metode for å verifisere om frekvensene observert i hver kategori er kompatible med uavhengigheten mellom begge variablene.

Hvordan oppnås uavhengigheten mellom variabler?

For å evaluere uavhengigheten mellom variablene beregnes verdiene som vil indikere den absolutte uavhengigheten, som kalles "forventede frekvenser", sammenligne dem med prøvefrekvensene.

Som vanlig indikerer nullhypotesen (H0) at begge variablene er uavhengige, mens den alternative hypotesen (H1) indikerer at variablene har en viss grad av tilknytning eller forhold.

Korrelasjon mellom variabler

Således, som andre tester for samme formål, chi-kvadrat-testen den brukes til å se følelsen av sammenhengen mellom to nominelle variabler eller på et høyere nivå (For eksempel kan vi bruke den hvis vi vil vite om det er et forhold mellom sex [å være en mann eller en kvinne] og tilstedeværelsen av angst [ja eller nei]).

For å bestemme denne typen forhold, er det en tabell over frekvenser å konsultere (også for andre tester som Yule Q-koeffisienten).

Hvis de empiriske frekvensene og de teoretiske eller forventede frekvensene faller sammen, er det ingen sammenheng mellom variablene, det vil si at de er uavhengige. På den annen side, hvis de sammenfaller, er de ikke uavhengige (det er et forhold mellom variablene, for eksempel mellom X og Y).

Hensyn

Chi-kvadrat-testen, i motsetning til andre tester, etablerer ikke begrensninger på antall modaliteter per variabel, og antall rader og antall kolonner i tabellene trenger ikke å matche.

Det er imidlertid nødvendig at den brukes på studier basert på uavhengige prøver, og når alle forventede verdier er større enn 5. Som vi allerede har nevnt, er de forventede verdiene de som indikerer den absolutte uavhengigheten mellom begge variablene.

Også, for å bruke chi-kvadrat-testen, må målingsnivået være nominelt eller høyere. Den har ikke en øvre grense, det vil si tillater oss ikke å vite intensiteten i korrelasjonen. Med andre ord tar chi-firkanten verdier mellom 0 og uendelig.

På den annen side, hvis prøven øker, øker chi-kvadratverdien, men vi må være forsiktige i tolkningen, fordi det ikke betyr at det er mer sammenheng.

Chi-kvadrat fordeling

Chi-kvadrat-testen bruker en tilnærming til chi-kvadratfordelingen for å evaluere sannsynligheten for et avvik som er lik eller større enn det som eksisterer mellom dataene og de forventede frekvensene i henhold til nullhypotesen.

Nøyaktigheten av denne evalueringen vil avhenge av om de forventede verdiene ikke er veldig små, og i mindre grad at kontrasten mellom dem ikke er veldig høy.

Yates-korreksjon

Yates rettelse er en matematisk formel som brukes med 2x2 tabeller og med en liten teoretisk frekvens (mindre enn 10), for å korrigere mulige feil i chi-kvadrat-testen.

Generelt brukes Yates-korreksjonen eller "kontinuitetskorrigering". når en diskret variabel tilnærmer seg en kontinuerlig fordeling.

Hypotesekontrast

Videre chi-kvadrat test tilhører de såkalte goodness-of-fit-tester eller kontraster, som har som mål å avgjøre om hypotesen om at et gitt utvalg kommer fra en populasjon med en fullt spesifisert sannsynlighetsfordeling i nullhypotesen kan godtas.

Kontrastene er basert på sammenligningen av de observerte frekvensene (empiriske frekvenser) i prøve med de som forventes (teoretiske eller forventede frekvenser) hvis nullhypotesen var ekte. A) Ja, nullhypotesen avvises hvis det er en signifikant forskjell mellom de observerte og forventede frekvensene.

Fungerer

Som vi har sett, brukes chi-kvadrat-testen med data som tilhører en nominell skala eller høyere. Fra chi-kvadrat etableres en nullhypotese som postulerer en sannsynlighetsfordeling spesifisert som den matematiske modellen for populasjonen som har generert prøven.

Når vi har fått hypotesen, må vi utføre kontrasten, og for dette har vi dataene i en frekvenstabell. Den absolutte observerte eller empiriske frekvensen er indikert for hver verdi eller verdiområde. Forutsatt at nullhypotesen er sant, beregnes den absolutte frekvensen som forventet eller forventet frekvens for hver verdi eller intervall av verdier.

Tolkning

Chi-kvadratstatistikken vil ta en verdi lik 0 hvis det er perfekt samsvar mellom de observerte og forventede frekvensene; av ulemper, statistikken vil ta stor verdi hvis det er et stort avvik mellom disse frekvensene, og følgelig må nullhypotesen avvises.

Bibliografiske referanser:

  • Lubin, P. Macià, A. Rubio de Lerma, P. (2005). Matematisk psykologi I og II. Madrid: UNED.
  • Pardo, A. San Martín, R. (2006). Dataanalyse i psykologi II. Madrid: Pyramid.

De 12 viktigste sosiale problemene i Mexico

Mexico er et land med stor skjønnhet, fullt av drømmeaktige steder og med stor økologisk og kultu...

Les mer

De 11 delene av en e-post (forklart og med eksempler)

E-post har blitt et grunnleggende verktøy i vår tid takket være at vi kan sende meldinger raskt o...

Les mer

De 10 mest populære kjæledyrene

De 10 mest populære kjæledyrene

Rundt om i verden er det alle slags kjæledyr. Hunder, katter, fisk, papegøyer... listen over kjæl...

Les mer

instagram viewer