Kolmogorov-Smirnovin testi: mikä se on ja miten sitä käytetään tilastoissa
Tilastoissa parametriset ja ei-parametriset testit tunnetaan ja käytetään hyvin. Yleisesti käytetty ei-parametrinen testi on Kolmogorov-Smirnov-testi., jonka avulla voimme varmistaa, noudattavatko otospisteet normaalijakaumaa.
Se kuuluu niin kutsuttujen sopivuustestien ryhmään. Tässä artikkelissa tunnemme sen ominaisuudet, mihin se on tarkoitettu ja miten sitä käytetään.
- Aiheeseen liittyvä artikkeli: "Chi-neliö (χ²) -testi: mikä se on ja miten sitä käytetään tilastoissa"
ei-parametriset testit
Kolmogorov-Smirnovin testi on eräänlainen ei-parametrinen testi. Ei-parametrisia testejä (kutsutaan myös vapaaksi jakeluksi) käytetään päättelytilastoissa, ja niillä on seuraavat ominaisuudet:
- He ehdottavat hypoteeseja sopivuudesta, riippumattomuudesta...
- Muuttujien mittaustaso on alhainen (järjestys).
- Niissä ei ole liiallisia rajoituksia.
- Ne soveltuvat pieniin näytteisiin.
- Ne ovat kestäviä.
Kolmogorov-Smirnov-testi: ominaisuudet
Kolmogórov-Smirnovin testi kuuluu omaan tilastoon, erityisesti tilastoon päättelytilastot. Päätelmätilastoilla pyritään poimimaan tietoa populaatioista.
Se on a sopivuustesti, eli sitä käytetään varmistamaan, noudattavatko otoksesta saamamme pisteet normaalijakaumaa vai eivät. Toisin sanoen se mahdollistaa tietojoukon jakauman ja tietyn teoreettisen jakauman välisen yhteensopivuuden mittaamisen. Sen tavoitteena on osoittaa, ovatko tiedot peräisin populaatiosta, jolla on määritelty teoreettinen jakauma, eli Toisin sanoen se testaa, voisivatko havainnot tulla kohtuudella jakaumasta määritelty.
Kolmogorov-Smirnov-testi vastaa seuraavaan kysymykseen: Tulevatko otoshavainnot jostain oletetusta jakaumasta?
Nollahypoteesi ja vaihtoehtoinen hypoteesi
Sopivuustestinä se vastaa kysymykseen: "sopiiko (empiirinen) otantajakauma (teoreettiseen) populaatiojakaumaan?". Tässä tapauksessa, nollahypoteesi (H0) osoittaa, että empiirinen jakauma on samanlainen kuin teoreettinen (Nollahypoteesi on se, jota ei yritetä hylätä.) Toisin sanoen nollahypoteesi vahvistaa, että havaittu frekvenssijakauma on yhdenmukainen teoreettisen jakauman kanssa (ja siten hyvä sovitus).
Sitä vastoin vaihtoehtoinen hypoteesi (H1) ilmoittaa, että havaittu taajuusjakauma ei ole yhdenmukainen teoreettisen jakauman kanssa (huono sovitus). Kuten muissakin hypoteesikontrastitesteissä, symboli α (alfa) osoittaa testin merkitsevyystason.
- Saatat olla kiinnostunut: "Pearsonin korrelaatiokerroin: mikä se on ja miten sitä käytetään"
Miten se lasketaan?
Kolmogorov-Smirnov-testin tulosta edustaa kirjain Z. Z lasketaan suurimmasta erosta (absoluuttisessa arvossa) teoreettisen ja havaitun (empiirisen) kumulatiivisen jakaumafunktion välillä.
Oletukset
Kolmogorov-Smirnov-testin soveltamiseksi oikein on tehtävä sarja oletuksia. Ensinnäkin testi oletetaan, että testijakauman parametrit on määritetty aiemmin. Tämä menettely arvioi parametrit otoksesta.
Toisaalta, näytteen keskiarvo ja keskihajonta ovat normaalijakauman parametreja, näytteen minimi- ja maksimiarvot määrittelevät tasaisen jakauman alueen, näytteen keskiarvon on Poisson-jakauman parametri ja otoskeskiarvo on jakauman parametri eksponentiaalinen.
Kolmogorov-Smirnov-testin kyky havaita poikkeamat oletetusta jakaumasta voi heiketä huomattavasti. Vertaaksesi sitä normaalijakaumaan arvioiduilla parametreilla, kannattaa harkita mahdollisuutta käyttää K-S Lillliefors -testiä.
Sovellus
Kolmogorov-Smirnov-testillä voidaan tarkistaa, onko muuttuja (esimerkiksi arvosanat tai €-tulo) normaalijakautumassa. Tämä on joskus tarpeen tietää, koska monet parametriset testit edellyttävät, että niiden käyttämät muuttujat noudattavat normaalijakaumaa.
Edut
Jotkut Kolmogorov-Smirnov-testin edut ovat:
- Se on tehokkaampi kuin Chi-neliö (χ²) -testi (myös sopivuustesti).
- Se on helppo laskea ja käyttää, eikä se vaadi tietojen ryhmittelyä.
- Tilasto on riippumaton odotetusta frekvenssijakaumasta, se riippuu vain otoksen koosta.
Erot parametristen testien kanssa
Parametrisilla testeillä, toisin kuin ei-parametrisilla testeillä, kuten Kolmogorov-Smirnov-testillä, on seuraavat ominaisuudet:
- He tekevät hypoteeseja parametreista.
- Muuttujien mittaustaso on ainakin määrällinen.
- On olemassa useita oletuksia, jotka on täytettävä.
- He eivät menetä tietoja.
- Heillä on korkea tilastollinen voima.
Muutamia esimerkkejä parametrisista testeistä olisi: keskiarvojen eron t-testi tai ANOVA.