Education, study and knowledge

Test hi-kvadrat (χ²): kaj je in kako se uporablja v statistiki

V statistiki obstajajo različni testi za analizo razmerja med spremenljivkami. Nazivne spremenljivke so tiste, ki omogočajo razmerja med enakostjo in neenakostjo, kot je spol.

V tem članku bomo poznali enega od testov za analizo neodvisnosti med nominalnimi ali višjimi spremenljivkami: test hi-kvadrat s preverjanjem hipotez (Preizkusi ustreznosti).

  • Povezani članek: "Analiza variance (ANOVA): kaj je in kako se uporablja v statistiki"

Kaj je test hi-kvadrat?

Test hi-kvadrat, imenovan tudi hi-kvadrat (Χ2), je v preskusih, ki se nanašajo na opisno statistiko, natančneje opisno statistiko, ki se uporablja za preučevanje dveh spremenljivk. Opisna statistika se osredotoča na pridobivanje informacij o vzorcu. Namesto tega naključne statistike črpajo podatke o prebivalstvu.

Ime testa je značilno za Chi-kvadrat porazdelitev verjetnosti, na kateri temelji. Ta test je leta 1900 razvil Karl Pearson.

Test hi-kvadrat je ena najbolj znanih in se uporablja za analizo nominalnih ali kvalitativnih spremenljivk, to je za določitev obstoja ali neodvisnosti med dvema spremenljivkama. To, da sta dve spremenljivki neodvisni, pomeni, da nista v razmerju in da zato ena ni odvisna od druge, niti obratno.

instagram story viewer

Tako se je s preučevanjem neodvisnosti pojavila tudi metoda za preverjanje, ali so frekvence, opažene v posamezni kategoriji, združljive z neodvisnostjo obeh spremenljivk.

Kako se pridobi neodvisnost med spremenljivkami?

Za oceno neodvisnosti med spremenljivkami se izračunajo vrednosti, ki bi označevale absolutno neodvisnost, kar se imenuje "pričakovane frekvence", primerjava z vzorčnimi frekvencami.

Kot ponavadi nična hipoteza (H0) kaže, da sta obe spremenljivki neodvisni, alternativna hipoteza (H1) pa, da imajo spremenljivke določeno stopnjo povezanosti ali povezanosti.

Korelacija med spremenljivkami

Tako kot drugi testi za isti namen, test hi-kvadrat uporablja se za prikaz smisla korelacije med dvema nominalnima spremenljivkama ali višje ravni (Lahko ga na primer uporabimo, če želimo vedeti, ali obstaja povezava med spolom [biti moški ali ženska] in prisotnostjo tesnobe [da ali ne]).

Za določitev te vrste razmerja je na voljo preglednica frekvenc, ki jo je treba uporabiti (tudi za druge teste, kot je koeficient Yule Q).

Če empirične frekvence in teoretične ali pričakovane frekvence sovpadajo, potem ni spremenljivk, torej so neodvisne. Po drugi strani pa, če sovpadajo, niso neodvisni (obstaja povezava med spremenljivkama, na primer med X in Y).

Premisleki

Test hi-kvadrat v nasprotju z drugimi preskusi ne določa omejitev števila modalitet na spremenljivke in število vrstic in število stolpcev v tabelah se ne mora ujemati.

Vendar pa ga je treba uporabiti za študije, ki temeljijo na neodvisnih vzorcih in kadar so vse pričakovane vrednosti večje od 5. Kot smo že omenili, so pričakovane vrednosti tiste, ki kažejo na absolutno neodvisnost med obema spremenljivkama.

Za uporabo testa hi-kvadrat mora biti raven merjenja nominalna ali višja. Nima zgornje meje, to je, ne omogoča, da bi poznali intenzivnost korelacije. Z drugimi besedami, hi-kvadrat ima vrednosti med 0 in neskončnostjo.

Po drugi strani pa se, če se vzorec poveča, vrednost hi-kvadrat poveča, vendar moramo biti pri njegovi interpretaciji previdni, ker to ne pomeni, da obstaja več korelacije.

Hi-kvadrat porazdelitev

Test hi-kvadrat uporablja približek porazdelitve hi kvadrat za oceno verjetnosti odstopanja, enakega ali večjega od obstoječega med podatki in pričakovanimi frekvencami, v skladu z nično hipotezo.

Natančnost te ocene bo odvisna od tega, ali pričakovane vrednosti niso zelo majhne, ​​in v manjši meri, da kontrast med njimi ni zelo velik.

Yatesov popravek

Yatesov popravek je matematična formula, ki se uporablja v tabelah 2x2 in z majhno teoretično frekvenco (manj kot 10), da se popravijo morebitne napake testa hi-kvadrat.

Na splošno se uporablja Yatesov popravek ali "popravek kontinuitete". ko se diskretna spremenljivka približa neprekinjeni porazdelitvi.

Hipotezni kontrast

Poleg tega test hi-kvadrat spada med tako imenovane teste dobrega stanja ali kontraste, katerih cilj je odločiti, ali je mogoče sprejeti hipotezo, da dani vzorec prihaja iz populacije s popolnoma določeno verjetnostno porazdelitvijo v nični hipotezi.

Kontrasti temeljijo na primerjavi opazovanih frekvenc (empiričnih frekvenc) v vzorec s tistimi, ki bi bili pričakovani (teoretične ali pričakovane frekvence), če bi bila nična hipoteza prav. A) Da, nična hipoteza se zavrne če obstaja pomembna razlika med opazovano in pričakovano frekvenco.

Delovanje

Kot smo videli, se test hi-kvadrat uporablja s podatki, ki pripadajo nominalni lestvici ali več. Iz hi-kvadrata se vzpostavi nična hipoteza, ki postulira porazdelitev verjetnosti, določeno kot matematični model populacije, ki je ustvarila vzorec.

Ko imamo hipotezo, moramo izvesti kontrast in za to imamo podatke v frekvenčni tabeli. Absolutna opazovana ali empirična frekvenca je navedena za vsako vrednost ali obseg vrednosti. Nato ob predpostavki, da nična hipoteza drži, se za vsako vrednost ali interval vrednosti izračuna absolutna frekvenca, ki bi bila pričakovana ali pričakovana.

Tolmačenje

Statistika hi-kvadrat bo imela vrednost, ki je enaka 0, če obstaja popolno soglasje med opazovano in pričakovano frekvenco; po slabostih, statistika bo imela veliko vrednost, če obstaja velika razlika med temi frekvencami, zato je treba nično hipotezo zavrniti.

Bibliografske reference:

  • Lubin, P. Macià, A. Rubio de Lerma, P. (2005). Matematična psihologija I in II. Madrid: UNED.
  • Pardo, A. San Martín, R. (2006). Analiza podatkov v psihologiji II. Madrid: Piramida.

5 razlik med debetno in kreditno kartico

Karte so postale glavno plačilno sredstvo med ljudmi vseh starosti. Udobne so, enostavne za upora...

Preberi več

Filogenija in ontogenija: kaj so in kako se razlikujejo

Filogenija in ontogenija sta dve besedi, ki se pogosto pojavita skupaj, zaradi česar se večkrat p...

Preberi več

11 vrst kemičnih reakcij

Različne snovi, ki so prisotne v naravi, med seboj neprekinjeno sodelujejo. Tako pogoste stvari, ...

Preberi več