Kolmogorov-Smirnov-Test: Was es ist und wie es in der Statistik verwendet wird
In der Statistik sind parametrische und nicht-parametrische Tests bekannt und werden verwendet. Ein weit verbreiteter nichtparametrischer Test ist der Kolmogorov-Smirnov-Test., wodurch wir überprüfen können, ob die Stichprobenwerte einer Normalverteilung folgen oder nicht.
Er gehört zur Gruppe der sogenannten Goodness-of-Fit-Tests. In diesem Artikel werden wir seine Eigenschaften kennen, wofür es ist und wie es angewendet wird.
- Verwandter Artikel: "Chi-Quadrat (χ²)-Test: Was es ist und wie es in der Statistik verwendet wird"
Nichtparametrische Tests
Der Kolmogorov-Smirnov-Test ist eine Art nichtparametrischer Test. Nichtparametrische Tests (auch als freie Verteilung bezeichnet) werden in der Inferenzstatistik verwendet und haben die folgenden Eigenschaften:
- Sie schlagen Hypothesen zur Anpassungsfähigkeit, Unabhängigkeit...
- Das Messniveau der Variablen ist niedrig (ordinal).
- Sie haben keine übermäßigen Einschränkungen.
- Sie gelten für kleine Proben.
- Sie sind robust.
Kolmogorov-Smirnov-Test: Eigenschaften
Der Kolmogórov-Smirnov-Test gehört zu den eigenen Statistiken, speziell zu Inferenzstatistik. Inferenzstatistik zielt darauf ab, Informationen über Populationen zu extrahieren.
es ist ein Anpassungstest, das heißt, es wird verwendet, um zu überprüfen, ob die Ergebnisse, die wir aus der Stichprobe erhalten haben, einer Normalverteilung folgen oder nicht. Das heißt, es ermöglicht die Messung des Übereinstimmungsgrades zwischen der Verteilung eines Datensatzes und einer bestimmten theoretischen Verteilung. Das Ziel besteht darin, anzuzeigen, ob die Daten aus einer Grundgesamtheit stammen, die die angegebene theoretische Verteilung aufweist Mit anderen Worten, es testet, ob die Beobachtungen vernünftigerweise aus der Verteilung stammen könnten angegeben.
Der Kolmogorov-Smirnov-Test befasst sich mit der folgenden Frage: Stammen die Stichprobenbeobachtungen von einer hypothetischen Verteilung?
Nullhypothese und Alternativhypothese
Als Anpassungstest beantwortet er die Frage: „Passt die (empirische) Stichprobenverteilung zur (theoretischen) Grundgesamtheitsverteilung?“. In diesem Fall, die Nullhypothese (H0) stellt fest, dass die empirische Verteilung ähnlich der theoretischen ist (Die Nullhypothese ist diejenige, deren Ablehnung nicht versucht wird.) Mit anderen Worten, die Nullhypothese stellt fest, dass die beobachtete Häufigkeitsverteilung mit der theoretischen Verteilung übereinstimmt (und daher gut passt).
Im Gegensatz dazu besagt die Alternativhypothese (H1), dass die beobachtete Häufigkeitsverteilung nicht mit der theoretischen Verteilung übereinstimmt (schlechte Anpassung). Wie bei anderen Hypothesenkontrasttests zeigt das Symbol α (Alpha) das Signifikanzniveau des Tests an.
- Das könnte Sie interessieren: "Pearsons Korrelationskoeffizient: was es ist und wie man es verwendet"
Wie wird es berechnet?
Das Ergebnis des Kolmogorov-Smirnov-Tests wird durch den Buchstaben Z dargestellt. Das Z errechnet sich aus der größten Differenz (im Absolutwert) zwischen den theoretischen und beobachteten (empirischen) kumulativen Verteilungsfunktionen.
Annahmen
Um den Kolmogorov-Smirnov-Test korrekt anzuwenden, müssen eine Reihe von Annahmen getroffen werden. Erstens die Prüfung setzt voraus, dass die Parameter der Testverteilung zuvor spezifiziert wurden. Dieses Verfahren schätzt die Parameter aus der Stichprobe.
Andererseits, der Stichprobenmittelwert und die Standardabweichung sind die Parameter einer Normalverteilung, die Minimal- und Maximalwerte der Stichprobe definieren den Bereich der Gleichverteilung, den Stichprobenmittelwert ist der Parameter der Poisson-Verteilung und der Stichprobenmittelwert ist der Parameter der Verteilung exponentiell.
Die Fähigkeit des Kolmogorov-Smirnov-Tests, Abweichungen von der hypothetischen Verteilung zu erkennen, kann stark beeinträchtigt sein. Um es einer Normalverteilung mit geschätzten Parametern gegenüberzustellen, die Möglichkeit der Verwendung des K-S-Lilliefors-Tests sollte in Betracht gezogen werden.
Anwendung
Der Kolmogorov-Smirnov-Test kann auf eine Stichprobe angewendet werden, um zu überprüfen, ob eine Variable (z. B. Schulnoten oder €-Einkommen) normalverteilt ist. Dies ist manchmal notwendig, da viele parametrische Tests erfordern, dass die verwendeten Variablen einer Normalverteilung folgen.
Vorteile
Einige die Vorteile des Kolmogorov-Smirnov-Tests Sind:
- Er ist aussagekräftiger als der Chi-Quadrat-Test (χ²) (ebenfalls ein Anpassungstest).
- Es ist einfach zu berechnen und zu verwenden und erfordert keine Gruppierung der Daten.
- Die Statistik ist unabhängig von der erwarteten Häufigkeitsverteilung, sie hängt nur vom Stichprobenumfang ab.
Unterschiede zu parametrischen Tests
Parametrische Tests haben im Gegensatz zu nicht-parametrischen Tests wie dem Kolmogorov-Smirnov-Test die folgenden Eigenschaften:
- Sie stellen Hypothesen über Parameter auf.
- Das Messniveau der Variablen ist zumindest quantitativ.
- Es gibt eine Reihe von Annahmen, die erfüllt sein müssen.
- Sie verlieren keine Informationen.
- Sie haben eine hohe statistische Aussagekraft.
Einige Beispiele parametrischer Tests wäre: der t-Test für die Differenz der Mittelwerte oder die ANOVA.