Kolmogorov-Smirnov test: kaj je in kako se uporablja v statistiki
V statistiki so parametrični in neparametrični testi dobro poznani in uporabljeni. Široko uporabljen neparametrični test je Kolmogorov-Smirnov test., ki nam omogoča, da preverimo, ali vzorčni rezultati sledijo normalni porazdelitvi ali ne.
Spada v skupino tako imenovanih testov primernosti. V tem članku bomo spoznali njegove značilnosti, čemu je namenjen in kako se uporablja.
- Sorodni članek: "Hi-kvadrat (χ²) test: kaj je in kako se uporablja v statistiki"
neparametrični testi
Kolmogorov-Smirnov test je vrsta neparametričnega testa. Neparametrični testi (imenovani tudi prosta distribucija) se uporabljajo v inferencialni statistiki in imajo naslednje značilnosti:
- Predlagajo hipoteze o primernosti, neodvisnosti ...
- Stopnja merjenja spremenljivk je nizka (ordinalna).
- Nimajo pretiranih omejitev.
- Uporabljajo se za majhne vzorce.
- So robustni.
Kolmogorov-Smirnov test: značilnosti
Test Kolmogórov-Smirnov je eden od svojih lastnih lastnosti v statistiki, natančneje v inferencialna statistika. Inferencialna statistika je namenjena pridobivanju informacij o prebivalstvu.
Je test primernosti, to pomeni, da se uporablja za preverjanje, ali rezultati, ki smo jih dobili iz vzorca, sledijo normalni porazdelitvi ali ne. To pomeni, da omogoča merjenje stopnje ujemanja med porazdelitvijo nabora podatkov in specifično teoretično porazdelitvijo. Njegov cilj je navesti, ali podatki prihajajo iz populacije, ki ima določeno teoretično porazdelitev, tj Z drugimi besedami, preizkuša, ali lahko opazovanja razumno izvirajo iz distribucije določeno.
Kolmogorov-Smirnov test obravnava naslednje vprašanje: Ali vzorčna opažanja izhajajo iz neke hipotetične porazdelitve?
Ničelna hipoteza in alternativna hipoteza
Kot test primernosti odgovarja na vprašanje: "ali (empirična) porazdelitev vzorčenja ustreza (teoretični) porazdelitvi populacije?". V tem primeru, ničelna hipoteza (H0) bo ugotovila, da je empirična porazdelitev podobna teoretični (Ničelna hipoteza je tista, ki je ne poskušamo zavrniti.) Z drugimi besedami, ničelna hipoteza bo ugotovila, da je opazovana frekvenčna porazdelitev skladna s teoretično porazdelitvijo (in torej dobro prileganje).
Nasprotno pa bo alternativna hipoteza (H1) trdila, da opazovana porazdelitev frekvenc ni skladna s teoretično porazdelitvijo (slabo prileganje). Kot pri drugih testih kontrasta hipotez bo simbol α (alfa) označeval stopnjo pomembnosti testa.
- Morda vas zanima: "Pearsonov korelacijski koeficient: kaj je in kako ga uporabljati"
Kako se izračuna?
Rezultat Kolmogorov-Smirnovega testa je predstavljen s črko Z. Z se izračuna iz največje razlike (v absolutni vrednosti) med teoretično in opazovano (empirično) kumulativno porazdelitveno funkcijo.
Predpostavke
Za pravilno uporabo Kolmogorov-Smirnovega testa je treba sprejeti vrsto predpostavk. Prvič, test predpostavlja, da so bili parametri testne porazdelitve predhodno določeni. Ta postopek oceni parametre iz vzorca.
Po drugi strani, vzorčno povprečje in standardni odklon sta parametra normalne porazdelitve, najmanjša in največja vrednost vzorca določata obseg enakomerne porazdelitve, vzorčno povprečje je parameter Poissonove porazdelitve, vzorčna sredina pa je parameter porazdelitve eksponentno.
Sposobnost Kolmogorov-Smirnovega testa za odkrivanje odstopanj od hipotetične porazdelitve je lahko močno zmanjšana. Da bi jo primerjali z normalno porazdelitvijo z ocenjenimi parametri, razmisliti je treba o možnosti uporabe testa K-S Lillliefors.
Aplikacija
Test Kolmogorov-Smirnov lahko uporabimo za vzorec, da preverimo, ali je spremenljivka (na primer akademske ocene ali dohodek v evrih) normalno porazdeljena. To je včasih treba vedeti, saj številni parametrični testi zahtevajo, da spremenljivke, ki jih uporabljajo, sledijo normalni porazdelitvi.
Prednosti
Nekaj prednosti Kolmogorov-Smirnovega testa so:
- Je močnejši od testa hi-kvadrat (χ²) (tudi test primernosti).
- Je enostaven za izračun in uporabo ter ne zahteva združevanja podatkov.
- Statistika je neodvisna od pričakovane frekvenčne porazdelitve, odvisna je le od velikosti vzorca.
Razlike s parametričnimi testi
Parametrični testi imajo za razliko od neparametričnih testov, kot je Kolmogorov-Smirnov test, naslednje značilnosti:
- Postavljajo hipoteze o parametrih.
- Stopnja merjenja spremenljivk je vsaj kvantitativna.
- Obstajajo številne predpostavke, ki morajo biti izpolnjene.
- Ne izgubijo informacij.
- Imajo visoko statistično moč.
Nekaj primerov parametričnih testov bi bil: t-test za razliko v povprečjih ali ANOVA.