Chi-Quadrat-Test (χ²): Was es ist und wie es in der Statistik verwendet wird
In der Statistik gibt es verschiedene Tests, um die Beziehung zwischen Variablen zu analysieren. Nominale Variablen sind solche, die Beziehungen von Gleichheit und Ungleichheit zulassen, wie etwa das Geschlecht.
In diesem Artikel werden wir einen der Tests kennen, um die Unabhängigkeit zwischen nominalen oder höheren Variablen zu analysieren: der Chi-Quadrat-Test durch Hypothesentests (Tests der Güte der Passform).
- Verwandter Artikel: "Varianzanalyse (ANOVA): was es ist und wie es in der Statistik verwendet wird"
Was ist der Chi-Quadrat-Test?
Der Chi-Quadrat-Test, auch Chi-Quadrat (Χ2) genannt, gehört zu den Tests zur deskriptiven Statistik, insbesondere zur deskriptiven Statistik, die auf die Untersuchung von zwei Variablen angewendet wird. Die deskriptive Statistik konzentriert sich ihrerseits darauf, Informationen über die Stichprobe zu extrahieren. Stattdessen extrahieren inferentielle Statistiken Informationen über die Bevölkerung.
Der Name des Tests ist typisch für die Chi-Quadrat-Wahrscheinlichkeitsverteilung, auf der er basiert. Dieser Test wurde 1900 von Karl Pearson entwickelt.
Der Chi-Quadrat-Test ist einer der bekanntesten und wird verwendet, um nominale oder qualitative Variablen zu analysieren, d. h. um die Existenz oder Nicht-Unabhängigkeit zwischen zwei Variablen zu bestimmen. Dass zwei Variablen unabhängig sind, bedeutet, dass sie keine Beziehung haben und daher die eine nicht von der anderen abhängt und umgekehrt.
Somit wird mit der Unabhängigkeitsstudie auch eine Methode entwickelt, um zu überprüfen, ob die beobachteten Häufigkeiten in jeder Kategorie mit der Unabhängigkeit zwischen beiden Variablen vereinbar sind.
Wie wird die Unabhängigkeit zwischen Variablen erreicht?
Um die Unabhängigkeit zwischen den Variablen zu bewerten, werden die Werte berechnet, die die absolute Unabhängigkeit anzeigen würden, die als "erwartete Häufigkeiten" bezeichnet werden. Vergleich mit den Abtastfrequenzen.
Wie üblich zeigt die Nullhypothese (H0) an, dass beide Variablen unabhängig sind, während die Alternativhypothese (H1) anzeigt, dass die Variablen einen gewissen Grad an Assoziation oder Beziehung aufweisen.
Korrelation zwischen Variablen
Daher ist der Chi-Quadrat-Test, wie andere Tests für den gleichen Zweck, es wird verwendet, um den Sinn der Korrelation zwischen zwei nominalen Variablen oder auf einem höheren Niveau zu sehen (Wir können es zum Beispiel anwenden, wenn wir wissen möchten, ob es eine Beziehung zwischen Sex [Mann oder Frau sein] und dem Vorhandensein von Angst [ja oder nein] gibt).
Um diese Art von Beziehung zu bestimmen, gibt es eine Tabelle mit Häufigkeiten (auch für andere Tests wie den Yule-Q-Koeffizienten).
Stimmen die empirischen Häufigkeiten und die theoretischen oder erwarteten Häufigkeiten überein, dann besteht kein Zusammenhang zwischen den Variablen, dh sie sind unabhängig. Andererseits sind sie, wenn sie zusammenfallen, nicht unabhängig (es besteht eine Beziehung zwischen den Variablen, zum Beispiel zwischen X und Y).
Überlegungen
Der Chi-Quadrat-Test legt im Gegensatz zu anderen Tests keine Beschränkungen für die Anzahl der Modalitäten pro Variable fest, und die Anzahl der Zeilen und die Anzahl der Spalten in den Tabellen müssen nicht übereinstimmen.
Es ist jedoch notwendig, dass es auf Studien angewendet wird, die auf unabhängigen Stichproben basieren und wenn alle erwarteten Werte größer als 5 sind. Wie wir bereits erwähnt haben, sind die erwarteten Werte diejenigen, die die absolute Unabhängigkeit zwischen beiden Variablen angeben.
Außerdem muss der Messpegel nominal oder höher sein, um den Chi-Quadrat-Test verwenden zu können. Es gibt keine Obergrenze, d.h. erlaubt uns nicht, die Intensität der Korrelation zu kennen. Mit anderen Worten, das Chi-Quadrat nimmt Werte zwischen 0 und unendlich an.
Auf der anderen Seite, wenn die Stichprobe zunimmt, steigt der Chi-Quadrat-Wert, aber wir müssen bei seiner Interpretation vorsichtig sein, denn das bedeutet nicht, dass es mehr Korrelation gibt.
Chi-Quadrat-Verteilung
Der Chi-Quadrat-Test verwendet eine Annäherung an die Chi-Quadrat-Verteilung die Wahrscheinlichkeit einer Diskrepanz gleich oder größer als die zwischen den Daten und den erwarteten Häufigkeiten gemäß der Nullhypothese bestehende zu bewerten
Die Genauigkeit dieser Auswertung hängt davon ab, ob die erwarteten Werte nicht sehr klein sind und in geringerem Maße, dass der Kontrast zwischen ihnen nicht sehr hoch ist.
Yates-Korrektur
Yates' Korrektur ist eine mathematische Formel, die mit 2x2 Tabellen und mit einer kleinen theoretischen Häufigkeit angewendet wird (weniger als 10), um die möglichen Fehler des Chi-Quadrat-Tests zu korrigieren.
Im Allgemeinen wird die Yates-Korrektur oder "Kontinuitätskorrektur" angewendet. wenn eine diskrete Variable sich einer stetigen Verteilung annähert.
Hypothesenkontrast
Außerdem ist der Chi-Quadrat-Test gehört zu den sogenannten Gütetests oder Kontrasten, die das Ziel haben zu entscheiden, ob die Hypothese, dass eine gegebene Stichprobe aus einer Grundgesamtheit mit einer vollständig spezifizierten Wahrscheinlichkeitsverteilung in der Nullhypothese stammt, akzeptiert werden kann.
Die Kontraste basieren auf dem Vergleich der beobachteten Frequenzen (empirische Frequenzen) im Stichprobe mit den zu erwartenden (theoretischen oder erwarteten Häufigkeiten), wenn die Nullhypothese wäre wahr. A) Ja, die Nullhypothese wird abgelehnt wenn es einen signifikanten Unterschied zwischen den beobachteten und den erwarteten Häufigkeiten gibt.
Funktion
Wie wir gesehen haben, wird der Chi-Quadrat-Test mit Daten verwendet, die zu einer nominalen Skala oder höher gehören. Aus dem Chi-Quadrat wird eine Nullhypothese aufgestellt, die eine Wahrscheinlichkeitsverteilung postuliert, die als mathematisches Modell der Grundgesamtheit angegeben wird, die die Stichprobe erzeugt hat.
Sobald wir die Hypothese haben, müssen wir den Kontrast durchführen, und dazu haben wir die Daten in einer Häufigkeitstabelle. Für jeden Wert bzw. Wertebereich wird die absolute beobachtete bzw. empirische Häufigkeit angegeben. Unter der Annahme, dass die Nullhypothese wahr ist, wird dann für jeden Wert oder jedes Werteintervall die zu erwartende absolute Häufigkeit oder erwartete Häufigkeit berechnet.
Interpretation
Die Chi-Quadrat-Statistik nimmt einen Wert gleich 0 an, wenn eine perfekte Übereinstimmung zwischen den beobachteten und erwarteten Häufigkeiten besteht; nach Contras, die Statistik nimmt einen großen Wert an, wenn eine große Diskrepanz zwischen diesen Häufigkeiten besteht, weshalb die Nullhypothese verworfen werden muss.
Bibliographische Referenzen:
- Lubin, P. Macia, A. Rubio de Lerma, P. (2005). Mathematische Psychologie I und II. Madrid: UNED.
- Pardo, A. San Martin, R. (2006). Datenanalyse in der Psychologie II. Madrid: Pyramide.