Chi-ruuttest (χ²): mis see on ja kuidas seda statistikas kasutatakse
Statistikas on muutujate vahelise seose analüüsimiseks erinevaid teste. Nominaalsed muutujad on need, mis võimaldavad võrdsuse ja ebavõrdsuse suhteid, näiteks sugu.
Selles artiklis teame üht testi nominaalsete või kõrgemate muutujate sõltumatuse analüüsimiseks: chi-ruuttesti hüpoteeside testimise kaudu (Sobivuse testid).
- Seotud artikkel: "Dispersioonanalüüs (ANOVA): mis see on ja kuidas seda statistikas kasutatakse"
Mis on chi-ruudu test?
Chi-ruudu test, mida nimetatakse ka Chi-ruuduks (Χ2), on kirjeldava statistikaga seotud testide piires, täpsemalt kahe muutuja uurimiseks rakendatav kirjeldav statistika. Kirjeldav statistika keskendub omalt poolt valimi kohta teabe hankimisele. Selle asemel eraldab järeldav statistika elanikkonna kohta teavet.
Testi nimi on tüüpiline tõenäosuse Chi-ruutjaotusele, millel see põhineb. See test töötas välja 1900. aastal Karl Pearson.
Ki-ruudu test on üks tuntumaid ja seda kasutatakse nominaalsete või kvalitatiivsete muutujate analüüsimiseks, see tähendab kahe muutuja vahelise sõltumatuse olemasolu tuvastamiseks. See, et kaks muutujat on sõltumatud, tähendab, et neil pole suhet ja seepärast ei sõltu üks teisest ega ka vastupidi.
Seega on sõltumatuse uurimisel loodud ka meetod, mille abil kontrollida, kas igas kategoorias täheldatud sagedused on kooskõlas mõlema muutuja sõltumatusega.
Kuidas saadakse muutujate sõltumatus?
Muutujate vahelise sõltumatuse hindamiseks arvutatakse absoluutset sõltumatust tähistavad väärtused, mida nimetatakse eeldatavateks sagedusteks, nende võrdlemine valimisagedustega.
Nagu tavaliselt, näitab nullhüpotees (H0), et mõlemad muutujad on sõltumatud, samas kui alternatiivne hüpotees (H1) näitab, et muutujatel on teatud määral seos või seos.
Muutujate korrelatsioon
Seega, nagu ka teised sama eesmärgi testid, on ka chi-ruudu test seda kasutatakse kahe nominaalse muutuja või kõrgema taseme vahelise seose mõistmiseks (Näiteks saame seda rakendada, kui tahame teada, kas seksi [mees või naine olemine] ja ärevuse olemasolu [jah või ei] vahel on olemas).
Seda tüüpi seose kindlakstegemiseks on olemas sageduste tabel, mille poole pöörduda (ka muude testide, näiteks Yule Q koefitsiendi puhul).
Kui empiirilised sagedused ja teoreetilised või eeldatavad sagedused langevad kokku, siis muutujate vahel pole mingit seost, see tähendab, et need on sõltumatud. Teisest küljest, kui need langevad kokku, pole nad sõltumatud (muutujate vahel on seos, näiteks X ja Y vahel).
Kaalutlused
Erinevalt teistest testidest ei sea chi-ruudu test piiranguid muutujate arvu modaalsuste arvule ja ridade arv ja veergude arv tabelites ei pea vastama.
Seda tuleb siiski rakendada sõltumatutel valimitel põhinevate uuringute korral ja kui kõik eeldatavad väärtused on suuremad kui 5. Nagu me juba mainisime, on eeldatavad väärtused need, mis näitavad mõlema muutuja absoluutset sõltumatust.
Ki-ruuttesti kasutamiseks peab mõõtmistase olema nominaalne või kõrgem. Sellel ei ole ülemist piiri, see tähendab ei võimalda meil teada korrelatsiooni intensiivsust. Teisisõnu võtab chi-ruut väärtused vahemikku 0 kuni lõpmatus.
Teisalt, kui valim suureneb, suureneb khi-ruudu väärtus, kuid selle tõlgendamisel peame olema ettevaatlikud, sest see ei tähenda, et korrelatsiooni oleks rohkem.
Chi-ruutjaotus
Chi-ruudu test kasutab lähendust chi ruutjaotusele nullhüpoteesi kohaselt hinnata andmete ja eeldatavate sageduste vahel esineva lahknevuse tõenäosust, mis on võrdne või suurem.
Selle hindamise täpsus sõltub sellest, kas oodatavad väärtused ei ole väga väikesed ja vähemal määral ka sellest, et nende vaheline kontrast pole eriti suur.
Yatesi parandus
Yatesi parandus on matemaatiline valem, mida rakendatakse 2x2 tabeliga ja väikese teoreetilise sagedusega (vähem kui 10), et parandada khi-ruuttesti võimalikke vigu.
Üldiselt rakendatakse Yatesi korrektsiooni või "järjepidevuse parandust". kui diskreetne muutuja ligikaudne pidev jaotus.
Hüpoteesi kontrastsus
Lisaks chi-ruudu test kuulub nn sobivuse testide või kontrastide hulka, mille eesmärk on otsustada, kas hüpoteesi, et antud valim pärineb nullhüpoteesis täielikult määratletud tõenäosusjaotusega populatsioonist, saab aktsepteerida.
Kontrastid põhinevad vaadeldavate sageduste (empiiriliste sageduste) võrdlemisel valim nendega, mida oleks oodata (teoreetilised või eeldatavad sagedused), kui nullhüpotees oleks tõsi. A) Jah, nullhüpotees lükatakse tagasi kui täheldatud ja eeldatavate sageduste vahel on oluline erinevus.
Toimimine
Nagu nägime, kasutatakse chi-ruutu testi nominaalskaalasse või kõrgemasse kuuluvate andmetega. Ki-ruudu põhjal püstitatakse nullhüpotees, mis postuleerib valimi genereerinud populatsiooni matemaatilise mudelina määratud tõenäosuse jaotuse.
Kui hüpotees on olemas, peame teostama kontrasti ja selleks on meil andmed sagedustabelis. Absoluutne täheldatud või empiiriline sagedus on näidatud iga väärtuse või väärtuste vahemiku kohta. Seejärel, eeldades, et nullhüpotees vastab tõele, arvutatakse iga väärtuse või väärtuste intervalli jaoks absoluutne sagedus, mida oleks oodata või oodata.
Tõlgendamine
Ki-ruudu statistika saab väärtuseks 0, kui vaadeldava ja eeldatava sageduse vahel on täiuslik kokkulepe; miinuste järgi, statistika võtab suure väärtuse, kui nende sageduste vahel on suur erinevusja järelikult tuleb nullhüpotees tagasi lükata.
Bibliograafilised viited:
- Lubin, P. Macià, A. Rubio de Lerma, P. (2005). Matemaatiline psühholoogia I ja II. Madrid: UNED.
- Pardo, A. San Martín, R. (2006). Andmete analüüs psühholoogias II. Madrid: püramiid.