Education, study and knowledge

Chi-kwadraattoets (χ²): wat het is en hoe het wordt gebruikt in statistieken

In de statistiek zijn er verschillende tests om de relatie tussen variabelen te analyseren. Nominale variabelen zijn variabelen die relaties van gelijkheid en ongelijkheid mogelijk maken, zoals geslacht.

In dit artikel zullen we een van de tests kennen om de onafhankelijkheid tussen nominale of hogere variabelen te analyseren: de chikwadraattoets, door middel van hypothesetoetsing (Tests van goedheid van pasvorm).

  • Gerelateerd artikel: "Variantieanalyse (ANOVA): wat het is en hoe het wordt gebruikt in statistieken"

Wat is de chikwadraattoets?

De chi-kwadraattoets, ook wel Chi-kwadraat (Χ2) genoemd, valt binnen de tests met betrekking tot beschrijvende statistiek, met name beschrijvende statistiek die wordt toegepast op de studie van twee variabelen. Beschrijvende statistiek van zijn kant richt zich op het extraheren van informatie over het monster. In plaats daarvan extraheren inferentiële statistieken informatie over de bevolking.

De naam van de test is typerend voor de chikwadraatverdeling van de kans waarop deze is gebaseerd. Deze test werd in 1900 ontwikkeld door Karl Pearson.

instagram story viewer

De chikwadraattoets is een van de bekendste en wordt gebruikt om nominale of kwalitatieve variabelen te analyseren, dat wil zeggen om het bestaan ​​of niet van onafhankelijkheid tussen twee variabelen te bepalen. Dat twee variabelen onafhankelijk zijn, betekent dat ze geen relatie hebben en dat de ene dus niet van de andere afhankelijk is, en vice versa.

Zo is met het onderzoek naar onafhankelijkheid ook een methode ontstaan ​​om na te gaan of de frequenties die in elke categorie worden waargenomen verenigbaar zijn met de onafhankelijkheid tussen beide variabelen.

Hoe wordt de onafhankelijkheid tussen variabelen verkregen?

Om de onafhankelijkheid tussen de variabelen te evalueren, worden de waarden berekend die de absolute onafhankelijkheid zouden aangeven, wat "verwachte frequenties" wordt genoemd. ze te vergelijken met de samplefrequenties.

Zoals gebruikelijk geeft de nulhypothese (H0) aan dat beide variabelen onafhankelijk zijn, terwijl de alternatieve hypothese (H1) aangeeft dat de variabelen een zekere mate van associatie of verband hebben.

Correlatie tussen variabelen

Dus, net als andere tests voor hetzelfde doel, is de chikwadraattest het wordt gebruikt om de betekenis van de correlatie tussen twee nominale variabelen of van een hoger niveau te zien (We kunnen het bijvoorbeeld toepassen als we willen weten of er een relatie is tussen seks [man of vrouw zijn] en de aanwezigheid van angst [ja of nee]).

Om dit type relatie te bepalen, is er een tabel met te raadplegen frequenties (ook voor andere tests zoals de Yule Q-coëfficiënt).

Als de empirische frequenties en de theoretische of verwachte frequenties samenvallen, dan is er geen relatie tussen de variabelen, dat wil zeggen dat ze onafhankelijk zijn. Aan de andere kant, als ze samenvallen, zijn ze niet onafhankelijk (er is een relatie tussen de variabelen, bijvoorbeeld tussen X en Y).

Overwegingen

De chikwadraattoets legt, in tegenstelling tot andere toetsen, geen beperkingen op aan het aantal modaliteiten per variabele, en het aantal rijen en het aantal kolommen in de tabellen hoeven niet overeen te komen.

Het is echter noodzakelijk dat het wordt toegepast op onderzoeken op basis van onafhankelijke steekproeven en wanneer alle verwachte waarden groter zijn dan 5. Zoals we al hebben vermeld, zijn de verwachte waarden de waarden die de absolute onafhankelijkheid tussen beide variabelen aangeven.

Om de chikwadraattoets te gebruiken, moet het meetniveau ook nominaal of hoger zijn. Het heeft geen bovengrens, dat wil zeggen, stelt ons niet in staat om de intensiteit van de correlatie te kennen. Met andere woorden, de chi-kwadraat neemt waarden aan tussen 0 en oneindig.

Aan de andere kant, als de steekproef toeneemt, neemt de chi-kwadraatwaarde toe, maar we moeten voorzichtig zijn met de interpretatie, want dat betekent niet dat er meer correlatie is.

Chi-kwadraatverdeling

De chikwadraattoets maakt gebruik van een benadering van de chi-kwadraatverdeling om de waarschijnlijkheid te evalueren van een discrepantie gelijk aan of groter dan die tussen de gegevens en de verwachte frequenties volgens de nulhypothese.

De nauwkeurigheid van deze evaluatie hangt af van het feit of de verwachte waarden niet erg klein zijn, en in mindere mate dat het contrast ertussen niet erg hoog is.

Yates-correctie

De correctie van Yates is: een wiskundige formule die wordt toegepast met 2x2 tabellen en met een kleine theoretische frequentie (minder dan 10), om de mogelijke fouten van de chikwadraattoets te corrigeren.

Over het algemeen wordt de Yates-correctie of "continuïteitscorrectie" toegepast. wanneer een discrete variabele een continue verdeling benadert.

Hypothese contrast

Verder is de chikwadraattoets behoort tot de zogenaamde goodness-of-fit tests of contrasten, die tot doel hebben te beslissen of de hypothese dat een bepaalde steekproef afkomstig is uit een populatie met een volledig gespecificeerde kansverdeling in de nulhypothese kan worden aanvaard.

De contrasten zijn gebaseerd op de vergelijking van de waargenomen frequenties (empirische frequenties) in de steekproef met die die zouden worden verwacht (theoretische of verwachte frequenties) als de nulhypothese was waar. A) Ja, de nulhypothese wordt verworpen als er een significant verschil is tussen de waargenomen en verwachte frequenties.

werking

Zoals we hebben gezien, wordt de chikwadraattoets gebruikt bij gegevens die behoren tot een nominale schaal of hoger. Op basis van chi-kwadraat wordt een nulhypothese vastgesteld die een kansverdeling postuleert die is gespecificeerd als het wiskundige model van de populatie die de steekproef heeft gegenereerd.

Zodra we de hypothese hebben, moeten we het contrast uitvoeren, en hiervoor hebben we de gegevens in een frequentietabel. De absoluut waargenomen of empirische frequentie wordt aangegeven voor elke waarde of reeks waarden. Vervolgens, ervan uitgaande dat de nulhypothese waar is, wordt voor elke waarde of interval van waarden de absolute frequentie berekend die zou worden verwacht of verwachte frequentie.

Interpretatie

De chikwadraatstatistiek zal een waarde aannemen die gelijk is aan 0 als er perfecte overeenstemming is tussen de waargenomen en verwachte frequenties; door nadelen, de statistiek zal een grote waarde aannemen als er een grote discrepantie is tussen deze frequenties, en bijgevolg moet de nulhypothese worden verworpen.

Bibliografische referenties:

  • Lubin, P. Macia, A. Rubio de Lerma, P. (2005). Wiskundige psychologie I en II. Madrid: UNED.
  • Pardo, A. San Martin, R. (2006). Data-analyse in de psychologie II. Madrid: Piramide.

De 10 functies van het besturingssysteem

Niemand twijfelt eraan dat computers iets fundamenteels zijn geworden in ons dagelijks leven, all...

Lees verder

De 16 papiersoorten: kenmerken en functies

Papier is zonder twijfel een van de meest gebruikte artikelen. Het wordt niet alleen gebruikt om ...

Lees verder

De 30 meest prominente en populaire muzieksoorten

De 30 meest prominente en populaire muzieksoorten

Muziek maakt al sinds onze geboorte deel uit van ons leven, en voor velen wordt het beschouwd als...

Lees verder