Education, study and knowledge

Chi-square test (χ²): vad det är och hur det används i statistik

I statistiken finns det olika tester för att analysera sambandet mellan variabler. Nominella variabler är de som tillåter förhållanden mellan jämlikhet och ojämlikhet, såsom kön.

I den här artikeln kommer vi att känna till ett av testerna för att analysera oberoende mellan nominella eller högre variabler: chi-kvadrat testet genom hypotes testning (Test av godhet av passform).

  • Relaterad artikel: "Analys av varians (ANOVA): vad det är och hur det används i statistik"

Vad är chi-kvadrat testet?

Chi-kvadrat testet, även kallat Chi-kvadrat (Χ2), ligger inom testerna avseende beskrivande statistik, speciellt beskrivande statistik som tillämpas på studien av två variabler. Beskrivande statistik fokuserar å sin sida på att extrahera information om provet. I stället extraherar statistik information om befolkningen.

Testets namn är typiskt för Chi-kvadratens fördelning av sannolikhet som den bygger på. Detta test utvecklades 1900 av Karl Pearson.

Chikvadrat-testet är en av de mest kända och används för att analysera nominella eller kvalitativa variabler, det vill säga för att bestämma förekomsten eller inte av oberoende mellan två variabler. Att två variabler är oberoende betyder att de inte har något samband, och att den ena därför inte är beroende av den andra eller vice versa.

instagram story viewer

Således, med studien av oberoende, uppstår också en metod för att verifiera om de frekvenser som observeras i varje kategori är kompatibla med oberoende mellan båda variablerna.

Hur erhålls oberoende mellan variabler?

För att utvärdera oberoende mellan variablerna beräknas de värden som skulle indikera det absoluta oberoende, vilket kallas "förväntade frekvenser", jämför dem med provfrekvenserna.

Som vanligt indikerar nollhypotesen (H0) att båda variablerna är oberoende, medan den alternativa hypotesen (H1) indikerar att variablerna har en viss koppling eller relation.

Korrelation mellan variabler

Således, som andra tester för samma ändamål, chi-kvadrat testet den används för att se känslan av korrelationen mellan två nominella variabler eller av en högre nivå (Till exempel kan vi tillämpa det om vi vill veta om det finns ett förhållande mellan kön [att vara man eller kvinna] och närvaron av ångest [ja eller nej]).

För att bestämma denna typ av relation finns en tabell över frekvenser att konsultera (även för andra tester som Yule Q-koefficienten).

Om de empiriska frekvenserna och de teoretiska eller förväntade frekvenserna sammanfaller, finns det inget samband mellan variablerna, det vill säga de är oberoende. Å andra sidan, om de sammanfaller, är de inte oberoende (det finns ett samband mellan variablerna, till exempel mellan X och Y).

Överväganden

Chikvadrat-testet, till skillnad från andra tester, skapar inte begränsningar för antalet modaliteter per variabler, och antalet rader och antalet kolumner i tabellerna behöver inte matcha.

Det är dock nödvändigt att det tillämpas på studier baserade på oberoende prover och när alla förväntade värden är större än 5. Som vi redan har nämnt är de förväntade värdena de som indikerar absolut oberoende mellan båda variablerna.

För att använda chi-kvadrat-testet måste mätnivån också vara nominell eller högre. Den har ingen övre gräns, det vill säga tillåter oss inte att känna till korrelationsintensiteten. Med andra ord tar chi-kvadrat värden mellan 0 och oändlighet.

Å andra sidan, om provet ökar, ökar chi-kvadratvärdet, men vi måste vara försiktiga i dess tolkning, för det betyder inte att det finns mer korrelation.

Chi-kvadratfördelning

Chi-kvadrat testet använder en approximation till chi-kvadratfördelningen för att utvärdera sannolikheten för en avvikelse som är lika med eller större än den som finns mellan data och de förväntade frekvenserna enligt nollhypotesen.

Noggrannheten för denna utvärdering kommer att bero på om de förväntade värdena inte är mycket små och i mindre utsträckning på om kontrasten mellan dem inte är särskilt hög.

Yates-korrigering

Yates korrigering är en matematisk formel som används med 2x2 tabeller och med en liten teoretisk frekvens (mindre än 10) för att korrigera eventuella fel i chi-kvadrat-testet.

Generellt tillämpas Yates-korrigering eller "kontinuitetskorrigering". när en diskret variabel approximerar en kontinuerlig fördelning.

Hypotes kontrast

Dessutom chi-kvadrat testet tillhör de så kallade goodness-of-fit-testerna eller kontrasterna, som har som mål att avgöra om hypotesen att ett givet urval kommer från en population med en fullständigt specificerad sannolikhetsfördelning i nollhypotesen kan accepteras.

Kontrasterna baseras på jämförelsen av de observerade frekvenserna (empiriska frekvenser) i prov med de som skulle förväntas (teoretiska eller förväntade frekvenser) om nollhypotesen var Sann. A) Ja, nollhypotesen förkastas om det finns en signifikant skillnad mellan de observerade och förväntade frekvenserna.

Fungerar

Som vi har sett används chi-kvadrat-testet med data som tillhör en nominell skala eller högre. Från chi-kvadrat fastställs en nollhypotes som postulerar en sannolikhetsfördelning specificerad som den matematiska modellen för den population som har genererat urvalet.

När vi väl har fått hypotesen måste vi utföra kontrasten, och för detta har vi uppgifterna i en frekvenstabell. Den absoluta observerade eller empiriska frekvensen anges för varje värde eller intervall av värden. Sedan antar vi att nollhypotesen är sant beräknas den absoluta frekvensen som kan förväntas eller förväntad frekvens för varje värde eller intervall av värden.

Tolkning

Chikvadratstatistiken kommer att ta ett värde lika med 0 om det finns perfekt överensstämmelse mellan de observerade och förväntade frekvenserna; av nackdelar, statistiken kommer att ta ett stort värde om det finns en stor avvikelse mellan dessa frekvenser, och följaktligen måste nollhypotesen avvisas.

Bibliografiska referenser:

  • Lubin, P. Macià, A. Rubio de Lerma, P. (2005). Matematisk psykologi I och II. Madrid: UNED.
  • Pardo, A. San Martín, R. (2006). Dataanalys i psykologi II. Madrid: Pyramid.

Hur får jag klara drömmar? Vetenskapen förklarar det för oss

De drömmar Y allt relaterat till dem är länge, en värld som väcker djupt intresse från både veten...

Läs mer

40 symboliska tatueringar med stor betydelse (med bilder)

40 symboliska tatueringar med stor betydelse (med bilder)

Tatueringar är på mode, du måste bara titta runt oss för att se att det finns många människor som...

Läs mer

50 saker att göra på helgen

50 saker att göra på helgen

Uttråkad när helgen rullar runt? Känner du att du inte vet vad du ska göra, men samtidigt vet du ...

Läs mer