Test Chi-pătrat (χ²): ce este și cum este utilizat în statistici
În statistici, există diferite teste pentru a analiza relația dintre variabile. Variabilele nominale sunt cele care permit relații de egalitate și inegalitate, cum ar fi genul.
În acest articol vom cunoaște unul dintre testele pentru a analiza independența dintre variabilele nominale sau superioare: testul chi-pătrat, prin testarea ipotezelor (Teste de bunătate de potrivire).
- Articol asociat: "Analiza varianței (ANOVA): ce este și cum este utilizată în statistici"
Ce este testul chi-pătrat?
Testul chi-pătrat, numit și Chi-pătrat (Χ2), se află în cadrul testelor referitoare la statisticile descriptive, în special statisticile descriptive aplicate studiului a două variabile. Statisticile descriptive, la rândul său, se concentrează pe extragerea informațiilor despre eșantion. În schimb, statisticile inferențiale extrag informații despre populație.
Numele testului este tipic distribuției de probabilitate Chi-pătrat pe care se bazează. Acest test a fost dezvoltat în 1900 de Karl Pearson.
Testul chi-pătrat este unul dintre cele mai cunoscute și utilizate pentru a analiza variabilele nominale sau calitative, adică pentru a determina existența sau nu a independenței între două variabile. Faptul că două variabile sunt independente înseamnă că nu au nicio relație și, prin urmare, una nu depinde de cealaltă și nici invers.
Astfel, odată cu studiul independenței, este creată și o metodă pentru a verifica dacă frecvențele observate în fiecare categorie sunt compatibile cu independența dintre ambele variabile.
Cum se obține independența dintre variabile?
Pentru a evalua independența dintre variabile, se calculează valorile care ar indica independența absolută, care se numește „frecvențe așteptate”, comparându-le cu frecvențele eșantionului.
Ca de obicei, ipoteza nulă (H0) indică faptul că ambele variabile sunt independente, în timp ce ipoteza alternativă (H1) indică faptul că variabilele au un anumit grad de asociere sau relație.
Corelația între variabile
Astfel, ca și alte teste cu același scop, testul chi-pătrat este folosit pentru a vedea sensul corelației dintre două variabile nominale sau a unui nivel superior (De exemplu, îl putem aplica dacă vrem să știm dacă există o relație între sex [a fi bărbat sau femeie] și prezența anxietății [da sau nu]).
Pentru a determina acest tip de relație, există un tabel de frecvențe de consultat (de asemenea, pentru alte teste, cum ar fi coeficientul Yule Q).
Dacă frecvențele empirice și frecvențele teoretice sau așteptate coincid, atunci nu există nicio relație între variabile, adică sunt independente. Pe de altă parte, dacă coincid, nu sunt independenți (există o relație între variabile, de exemplu între X și Y).
Considerații
Testul chi-pătrat, spre deosebire de alte teste, nu stabilește restricții privind numărul de modalități pe variabile și numărul de rânduri și numărul de coloane din tabele nu trebuie să se potrivească.
Cu toate acestea, este necesar ca acesta să fie aplicat studiilor bazate pe eșantioane independente și atunci când toate valorile așteptate sunt mai mari de 5. După cum am menționat deja, valorile așteptate sunt cele care indică independența absolută între ambele variabile.
De asemenea, pentru a utiliza testul chi-pătrat, nivelul de măsurare trebuie să fie nominal sau mai mare. Nu are o limită superioară, adică nu ne permite să cunoaștem intensitatea corelației. Cu alte cuvinte, chi-pătratul ia valori între 0 și infinit.
Pe de altă parte, dacă eșantionul crește, valoarea chi-pătrat crește, dar trebuie să fim prudenți în interpretarea acestuia, deoarece asta nu înseamnă că există mai multă corelație.
Distribuția Chi-pătrat
Testul chi-pătrat folosește o aproximare la distribuția chi pătrat pentru a evalua probabilitatea unei discrepanțe egală sau mai mare decât cea existentă între date și frecvențele așteptate conform ipotezei nule.
Acuratețea acestei evaluări va depinde de faptul dacă valorile așteptate nu sunt foarte mici și, într-o măsură mai mică, de faptul că contrastul dintre ele nu este foarte mare.
Yates Correction
Corecția lui Yates este o formulă matematică care se aplică cu tabele 2x2 și cu o frecvență teoretică mică (mai puțin de 10), pentru a corecta posibilele erori ale testului chi-pătrat.
În general, se aplică corecția Yates sau „corecția de continuitate”. când o variabilă discretă aproximează o distribuție continuă.
Contrast de ipoteză
În plus, testul chi-pătrat aparține așa-numitelor teste de bună-potrivire sau contraste, care au ca obiectiv să decidă dacă se poate accepta ipoteza că un eșantion dat provine dintr-o populație cu o distribuție de probabilitate complet specificată în ipoteza nulă.
Contrastele se bazează pe compararea frecvențelor observate (frecvențe empirice) în eșantion cu cele care ar fi de așteptat (frecvențe teoretice sau așteptate) dacă ipoteza nulă ar fi Adevărat. A) Da, ipoteza nulă este respinsă dacă există o diferență semnificativă între frecvențele observate și așteptate.
Funcționarea
După cum am văzut, testul chi-pătrat este utilizat cu date aparținând unei scări nominale sau mai mari. Din chi-pătrat, se stabilește o ipoteză nulă care postulează o distribuție de probabilitate specificată ca model matematic al populației care a generat eșantionul.
Odată ce avem ipoteza, trebuie să realizăm contrastul și pentru aceasta avem datele într-un tabel de frecvențe. Frecvența absolută observată sau empirică este indicată pentru fiecare valoare sau interval de valori. Apoi, presupunând că ipoteza nulă este adevărată, pentru fiecare valoare sau interval de valori se calculează frecvența absolută care ar fi așteptată sau frecvența așteptată.
Interpretare
Statistica chi-pătrat va lua o valoare egală cu 0 dacă există un acord perfect între frecvențele observate și cele așteptate; contra, statistica va lua o valoare mare dacă există o discrepanță mare între aceste frecvențeși, în consecință, ipoteza nulă trebuie respinsă.
Referințe bibliografice:
- Lubin, P. Macià, A. Rubio de Lerma, P. (2005). Psihologia matematică I și II. Madrid: UNED.
- Pardo, A. San Martín, R. (2006). Analiza datelor în psihologie II. Madrid: Piramida.