Education, study and knowledge

Chi-kvadrát test (χ²): čo to je a ako sa používa v štatistike

V štatistike existujú rôzne testy na analýzu vzťahu medzi premennými. Nominálne premenné sú tie, ktoré umožňujú vzťahy rovnosti a nerovnosti, napríklad pohlavie.

V tomto článku poznáme jeden z testov na analýzu nezávislosti medzi nominálnymi alebo vyššími premennými: test chí-kvadrát prostredníctvom testovania hypotéz (Skúšky dobrej kondície).

  • Súvisiaci článok: „Analýza odchýlky (ANOVA): čo to je a ako sa používa v štatistike"

Čo je to test chí-kvadrát?

Test chí-kvadrát, tiež nazývaný chí-kvadrát (Χ2), je v rámci testov týkajúcich sa deskriptívnej štatistiky, konkrétne deskriptívnej štatistiky použitej na štúdium dvoch premenných. Popisná štatistika sa naopak zameriava na extrakciu informácií o vzorke. Namiesto toho inferenčné štatistiky získavajú informácie o populácii.

Názov testu je typický pre chí-kvadrát rozdelenia pravdepodobnosti, na ktorom je založený. Tento test vyvinul v roku 1900 Karl Pearson.

Test chí-kvadrát je jedným z najznámejších a používa sa na analýzu nominálnych alebo kvalitatívnych premenných, to znamená na zistenie alebo neexistenciu nezávislosti medzi dvoma premennými. To, že dve premenné sú nezávislé, znamená, že nemajú žiadny vzťah, a preto jedna nezávisí od druhej, ani naopak.

instagram story viewer

Pri štúdiu nezávislosti teda tiež vznikla metóda na overenie, či sú frekvencie pozorované v každej kategórii zlučiteľné s nezávislosťou medzi obidvomi premennými.

Ako sa získa nezávislosť medzi premennými?

Na vyhodnotenie nezávislosti medzi premennými sa vypočítajú hodnoty, ktoré by naznačovali absolútnu nezávislosť, ktorá sa nazýva „očakávané frekvencie“, ich porovnanie s frekvenciami vzorkovania.

Ako obvykle nulová hypotéza (H0) naznačuje, že obe premenné sú nezávislé, zatiaľ čo alternatívna hypotéza (H1) naznačuje, že premenné majú určitý stupeň asociácie alebo vzťahu.

Korelácia medzi premennými

Rovnako ako ostatné testy na ten istý účel, test chí-kvadrát používa sa na to, aby sme videli zmysel korelácie medzi dvoma nominálnymi premennými alebo na vyššej úrovni (Napríklad ho môžeme použiť, ak chceme vedieť, či existuje vzťah medzi sexom [byť mužom alebo ženou] a prítomnosťou úzkosti [áno alebo nie]).

Na určenie tohto typu vzťahu existuje tabuľka frekvencií, ktoré je potrebné konzultovať (aj pri iných testoch, ako je napríklad Yule Q koeficient).

Ak sa empirické frekvencie zhodujú s teoretickými alebo očakávanými frekvenciami, potom medzi premennými nie je žiadny vzťah, to znamená, že sú nezávislé. Na druhej strane, ak sa zhodujú, nie sú nezávislé (medzi premennými existuje vzťah, napríklad medzi X a Y).

Úvahy

Test chí-kvadrát, na rozdiel od iných testov, nestanovuje obmedzenia počtu modalít na premennú a počet riadkov a počet stĺpcov v tabuľkách sa nemusí zhodovať.

Je však potrebné ho aplikovať na štúdie založené na nezávislých vzorkách, a keď sú všetky očakávané hodnoty väčšie ako 5. Ako sme už uviedli, očakávané hodnoty sú tie, ktoré naznačujú absolútnu nezávislosť medzi oboma premennými.

Pre použitie testu chí-kvadrát musí byť úroveň merania nominálna alebo vyššia. Nemá hornú hranicu, to znamená, neumožňuje poznať intenzitu korelácie. Inými slovami, chí-kvadrát nadobúda hodnoty od 0 do nekonečna.

Na druhej strane, ak sa vzorka zvýši, hodnota chí-kvadrátu sa zvýši, musíme však byť pri jej interpretácii opatrní, pretože to neznamená, že existuje viac korelácií.

Distribúcia chí-kvadrát

Test chí-kvadrát používa aproximáciu distribúcie štvorcov chi vyhodnotiť pravdepodobnosť nezrovnalosti, ktorá je rovnaká alebo väčšia ako tá, ktorá existuje medzi údajmi a očakávanými frekvenciami, podľa nulovej hypotézy.

Presnosť tohto vyhodnotenia bude závisieť od toho, či očakávané hodnoty nie sú veľmi malé, a v menšej miere od toho, či medzi nimi nie je veľmi vysoký kontrast.

Yatesova korekcia

Yatesova korekcia je matematický vzorec, ktorý sa používa s tabuľkami 2x2 as malou teoretickou frekvenciou (menej ako 10), aby sa opravili možné chyby testu chí-kvadrát.

Spravidla sa používa Yatesova korekcia alebo „korekcia kontinuity“. keď sa diskrétna premenná približuje spojitému rozdeleniu.

Kontrast hypotézy

Ďalej test chí-kvadrát patrí k takzvaným testom dobrej kondície alebo kontrastom, ktorých cieľom je rozhodnúť, či je možné prijať hypotézu, že daná vzorka pochádza z populácie s úplne špecifikovaným rozdelením pravdepodobnosti v nulovej hypotéze.

Kontrasty sú založené na porovnaní pozorovaných frekvencií (empirických frekvencií) v vzorka s tými, ktoré by sa dali očakávať (teoretická alebo očakávaná frekvencia), ak by bola nulová hypotéza pravda. A) Áno, nulová hypotéza je odmietnutá ak existuje významný rozdiel medzi pozorovanou a očakávanou frekvenciou.

Fungovanie

Ako sme videli, test chí-kvadrát sa používa s dátami patriacimi k nominálnej stupnici alebo vyššej. Z chí-kvadrátu sa vytvorí nulová hypotéza, ktorá postuluje rozdelenie pravdepodobnosti špecifikované ako matematický model populácie, ktorá generovala vzorku.

Keď máme hypotézu, musíme vykonať kontrast a preto máme údaje v tabuľke frekvencií. Pre každú hodnotu alebo rozsah hodnôt je uvedená absolútna pozorovaná alebo empirická frekvencia. Potom, za predpokladu, že nulová hypotéza je pravdivá, sa pre každú hodnotu alebo interval hodnôt počíta absolútna frekvencia, ktorá by sa očakávala alebo očakávaná frekvencia.

Výklad

Štatistika chí-kvadrát bude mať hodnotu rovnú 0, ak existuje dokonalá zhoda medzi pozorovanou a očakávanou frekvenciou; podľa mínusov, štatistika bude mať veľkú hodnotu, ak bude medzi týmito frekvenciami veľký rozpor, a následne musí byť zamietnutá nulová hypotéza.

Bibliografické odkazy:

  • Lubin, P. Macià, A. Rubio de Lerma, P. (2005). Matematická psychológia I a II. Madrid: UNED.
  • Pardo, A. San Martín, R. (2006). Analýza dát v psychológii II. Madrid: Pyramída.

Rôzne úrovne vedeckých dôkazov

V posledných storočiach veda napreduje vynúteným tempom. V rovnakom čase a v rôznych častiach sve...

Čítaj viac

Analýza kovariancie (ANCOVA): čo to je a ako sa používa v štatistike

Oblasť štatistiky využíva mnoho techník, ktoré nám umožňujú analyzovať, kontrolovať a upravovať ú...

Čítaj viac

Aký je rozdiel medzi „urobiť“ a „urobiť“?

Do. Toto sloveso môže mať veľké množstvo oblastí použitia a rôzne konotácie, napriek tomu, že jeh...

Čítaj viac

instagram viewer