Test Kołmogorowa-Smirnowa: co to jest i jak jest używany w statystyce
W statystyce dobrze znane i stosowane są testy parametryczne i nieparametryczne. Powszechnie stosowanym testem nieparametrycznym jest test Kołmogorowa-Smirnowa., co pozwala nam zweryfikować, czy wyniki próbek mają rozkład normalny.
Należy do grupy tzw. testów dobroci dopasowania. W tym artykule poznamy jego właściwości, do czego służy i jak się go stosuje.
- Powiązany artykuł: „Test chi-kwadrat (χ²): co to jest i jak jest używany w statystyce"
testy nieparametryczne
Test Kołmogorowa-Smirnowa jest rodzaj testu nieparametrycznego. Testy nieparametryczne (zwane także swobodną dystrybucją) są używane w statystyce wnioskowania i mają następujące cechy:
- Proponują hipotezy o dobroci dopasowania, niezależności...
- Poziom pomiaru zmiennych jest niski (porządkowy).
- Nie mają nadmiernych ograniczeń.
- Mają zastosowanie do małych próbek.
- Są wytrzymałe.
Test Kołmogorowa-Smirnowa: charakterystyka
Test Kołmogórowa-Smirnowa należy do statystyki, a konkretnie do statystyki inferencyjne. Statystyka inferencyjna ma na celu wydobycie informacji o populacjach.
To jest test dobroci dopasowania, to znaczy służy do sprawdzenia, czy wyniki, które uzyskaliśmy z próby, mają rozkład normalny. Oznacza to, że pozwala zmierzyć stopień zgodności między rozkładem zbioru danych a określonym rozkładem teoretycznym. Jego celem jest wskazanie, czy dane pochodzą z populacji, która ma określony rozkład teoretyczny, tj Innymi słowy, sprawdza, czy obserwacje mogą pochodzić z rozkładu określony.
Test Kołmogorowa-Smirnowa odpowiada na następujące pytanie: Czy przykładowe obserwacje pochodzą z jakiegoś hipotetycznego rozkładu?
Hipoteza zerowa i hipoteza alternatywna
Jako test dobroci dopasowania odpowiada na pytanie: „czy (empiryczny) rozkład próby pasuje do (teoretycznego) rozkładu populacji?”. W tym przypadku, hipoteza zerowa (H0) ustali, że rozkład empiryczny jest podobny do rozkładu teoretycznego (Hipoteza zerowa to taka, której nie próbuje się odrzucić). Innymi słowy, hipoteza zerowa ustali, że obserwowany rozkład częstości jest zgodny z rozkładem teoretycznym (a zatem dobrze dopasowany).
Natomiast hipoteza alternatywna (H1) będzie stwierdzać, że obserwowany rozkład częstości nie jest zgodny z rozkładem teoretycznym (złe dopasowanie). Podobnie jak w innych testach kontrastu hipotez, symbol α (alfa) będzie wskazywał poziom istotności testu.
- Możesz być zainteresowany: "Współczynnik korelacji Pearsona: co to jest i jak go używać"
Jak to jest obliczane?
Wynik testu Kołmogorowa-Smirnowa jest oznaczony literą Z. Z jest obliczany na podstawie największej różnicy (w wartości bezwzględnej) między teoretycznymi i obserwowanymi (empirycznymi) dystrybuantami skumulowanymi.
Założenia
Aby poprawnie zastosować test Kołmogorowa-Smirnowa, należy przyjąć szereg założeń. Po pierwsze test zakłada, że parametry rozkładu testowego zostały wcześniej określone. Ta procedura szacuje parametry z próbki.
Z drugiej strony, średnia próbki i odchylenie standardowe są parametrami rozkładu normalnego, minimalne i maksymalne wartości próbki określają zakres jednolitego rozkładu, średnią próbki jest parametrem rozkładu Poissona, a średnia próbki jest parametrem rozkładu wykładniczy.
Zdolność testu Kołmogorowa-Smirnowa do wykrywania odchyleń od hipotetycznego rozkładu może być poważnie ograniczona. Aby porównać to z rozkładem normalnym z oszacowanymi parametrami, należy rozważyć możliwość zastosowania testu K-S Lilllieforsa.
Aplikacja
Test Kołmogorowa-Smirnowa można zastosować do próby w celu sprawdzenia, czy zmienna (na przykład stopnie akademickie lub dochód €) ma rozkład normalny. Czasami jest to konieczne, aby wiedzieć, ponieważ wiele testów parametrycznych wymaga, aby zmienne, których używają, miały rozkład normalny.
Zalety
Niektóre z zalety testu Kołmogorowa-Smirnowa Czy:
- Jest potężniejszy niż test Chi-kwadrat (χ²) (również test dobroci dopasowania).
- Jest łatwy w obliczaniu i obsłudze oraz nie wymaga grupowania danych.
- Statystyka jest niezależna od oczekiwanego rozkładu częstości, zależy jedynie od wielkości próby.
Różnice z testami parametrycznymi
Testy parametryczne, w przeciwieństwie do testów nieparametrycznych, takich jak test Kołmogorowa-Smirnowa, mają następujące cechy:
- Stawiają hipotezy dotyczące parametrów.
- Poziom pomiaru zmiennych jest co najmniej ilościowy.
- Istnieje kilka założeń, które należy spełnić.
- Nie gubią informacji.
- Mają wysoką moc statystyczną.
Kilka przykładów testów parametrycznych byłoby: test t dla różnicy średnich lub ANOVA.