Δοκιμή τετραγώνου (χ²): τι είναι και πώς χρησιμοποιείται στις στατιστικές
Στα στατιστικά, υπάρχουν διάφορες δοκιμές για την ανάλυση της σχέσης μεταξύ των μεταβλητών. Οι ονομαστικές μεταβλητές είναι εκείνες που επιτρέπουν σχέσεις ισότητας και ανισότητας, όπως το φύλο.
Σε αυτό το άρθρο θα γνωρίζουμε μία από τις δοκιμές για την ανάλυση της ανεξαρτησίας μεταξύ ονομαστικών ή υψηλότερων μεταβλητών: το τεστ τετραγώνου, μέσω δοκιμών υπόθεσης (Δοκιμές καλοσύνης).
- Σχετικό άρθρο: "Ανάλυση διακύμανσης (ANOVA): τι είναι και πώς χρησιμοποιείται στις στατιστικές"
Τι είναι η δοκιμή chi-square;
Η δοκιμή chi-square, που ονομάζεται επίσης Chi-square (Χ2), βρίσκεται εντός των δοκιμών που αφορούν περιγραφικά στατιστικά στοιχεία, συγκεκριμένα περιγραφικά στατιστικά που εφαρμόζονται στη μελέτη δύο μεταβλητών. Τα περιγραφικά στατιστικά στοιχεία, από την πλευρά τους, επικεντρώνονται στην εξαγωγή πληροφοριών σχετικά με το δείγμα. Αντ 'αυτού, τα συμπεράσματα στατιστικών εξάγουν πληροφορίες σχετικά με τον πληθυσμό.
Το όνομα του τεστ είναι χαρακτηριστικό της κατανομής πιθανότητας Chi-square στην οποία βασίζεται. Αυτή η δοκιμή αναπτύχθηκε το 1900 από τον Karl Pearson.
Η δοκιμή chi-square είναι μια από τις πιο γνωστές και χρησιμοποιείται για την ανάλυση ονομαστικών ή ποιοτικών μεταβλητών, δηλαδή για τον προσδιορισμό της ύπαρξης ή μη της ανεξαρτησίας μεταξύ δύο μεταβλητών. Ότι οι δύο μεταβλητές είναι ανεξάρτητες σημαίνει ότι δεν έχουν καμία σχέση, και ότι επομένως η μία δεν εξαρτάται από την άλλη, ούτε το αντίστροφο.
Έτσι, με τη μελέτη της ανεξαρτησίας, δημιουργήθηκε επίσης μια μέθοδος για να εξακριβωθεί εάν οι συχνότητες που παρατηρούνται σε κάθε κατηγορία είναι συμβατές με την ανεξαρτησία μεταξύ των δύο μεταβλητών.
Πώς αποκτάται η ανεξαρτησία μεταξύ των μεταβλητών;
Για την αξιολόγηση της ανεξαρτησίας μεταξύ των μεταβλητών, υπολογίζονται οι τιμές που θα υποδεικνύουν την απόλυτη ανεξαρτησία, η οποία ονομάζεται «αναμενόμενες συχνότητες», συγκρίνοντάς τα με τις συχνότητες δειγμάτων.
Ως συνήθως, η μηδενική υπόθεση (H0) δείχνει ότι και οι δύο μεταβλητές είναι ανεξάρτητες, ενώ η εναλλακτική υπόθεση (H1) δείχνει ότι οι μεταβλητές έχουν κάποιο βαθμό συσχέτισης ή σχέσης.
Συσχέτιση μεταξύ μεταβλητών
Έτσι, όπως και άλλες δοκιμές για τον ίδιο σκοπό, η δοκιμή chi-square χρησιμοποιείται για να δείτε την έννοια της συσχέτισης μεταξύ δύο ονομαστικών μεταβλητών ή υψηλότερου επιπέδου (Για παράδειγμα, μπορούμε να το εφαρμόσουμε αν θέλουμε να μάθουμε εάν υπάρχει σχέση μεταξύ του φύλου [να είσαι άντρας ή μια γυναίκα] και την παρουσία άγχους [ναι ή όχι]).
Για να προσδιορίσετε αυτόν τον τύπο σχέσης, υπάρχει ένας πίνακας συχνοτήτων για διαβούλευση (επίσης για άλλες δοκιμές όπως ο συντελεστής Yule Q).
Εάν οι εμπειρικές συχνότητες και οι θεωρητικές ή αναμενόμενες συχνότητες συμπίπτουν, τότε δεν υπάρχει σχέση μεταξύ των μεταβλητών, δηλαδή είναι ανεξάρτητες. Από την άλλη πλευρά, εάν συμπίπτουν, δεν είναι ανεξάρτητες (υπάρχει σχέση μεταξύ των μεταβλητών, για παράδειγμα μεταξύ Χ και Υ).
Σκέψεις
Η δοκιμή chi-square, σε αντίθεση με άλλες δοκιμές, δεν καθορίζει περιορισμούς στον αριθμό των τρόπων ανά μεταβλητές και Ο αριθμός των σειρών και ο αριθμός των στηλών στους πίνακες δεν χρειάζεται να ταιριάζουν.
Ωστόσο, είναι απαραίτητο να εφαρμοστεί σε μελέτες που βασίζονται σε ανεξάρτητα δείγματα και όταν όλες οι αναμενόμενες τιμές είναι μεγαλύτερες από 5. Όπως έχουμε ήδη αναφέρει, οι αναμενόμενες τιμές είναι εκείνες που δείχνουν την απόλυτη ανεξαρτησία μεταξύ των δύο μεταβλητών.
Επίσης, για να χρησιμοποιήσετε τη δοκιμή chi-square, το επίπεδο μέτρησης πρέπει να είναι ονομαστικό ή υψηλότερο. Δεν έχει ανώτερο όριο, δηλαδή, δεν μας επιτρέπει να γνωρίζουμε την ένταση του συσχετισμού. Με άλλα λόγια, το chi-square παίρνει τιμές μεταξύ 0 και άπειρο.
Από την άλλη πλευρά, εάν το δείγμα αυξηθεί, η τιμή του τετραγώνου αυξάνεται, αλλά πρέπει να είμαστε προσεκτικοί στην ερμηνεία του, γιατί αυτό δεν σημαίνει ότι υπάρχει περισσότερη συσχέτιση.
Διανομή Chi-square
Το τεστ τετραγώνου χρησιμοποιεί μια προσέγγιση της κατανομής chi square για την αξιολόγηση της πιθανότητας ασυμφωνίας ίσης ή μεγαλύτερης από εκείνη που υπάρχει μεταξύ των δεδομένων και των αναμενόμενων συχνοτήτων σύμφωνα με την μηδενική υπόθεση.
Η ακρίβεια αυτής της αξιολόγησης θα εξαρτηθεί από το εάν οι αναμενόμενες τιμές δεν είναι πολύ μικρές και, σε μικρότερο βαθμό, ότι η αντίθεση μεταξύ τους δεν είναι πολύ υψηλή.
Διόρθωση Yates
Η διόρθωση του Yates είναι έναν μαθηματικό τύπο που εφαρμόζεται με πίνακες 2x2 και με μικρή θεωρητική συχνότητα (λιγότερο από 10), για να διορθώσετε τα πιθανά σφάλματα της δοκιμής chi-square.
Γενικά, εφαρμόζεται η διόρθωση Yates ή η "συνέχεια της διόρθωσης". όταν μια διακριτή μεταβλητή προσεγγίζει μια συνεχή κατανομή.
Αντίθεση υπόθεσης
Επιπλέον, η δοκιμή chi-square ανήκει στις λεγόμενες δοκιμές ή αντιθέσεις καλής προσαρμογής, που έχουν ως στόχο να αποφασίσουν εάν μπορεί να γίνει αποδεκτή η υπόθεση ότι ένα δεδομένο δείγμα προέρχεται από έναν πληθυσμό με πλήρως καθορισμένη κατανομή πιθανότητας στην μηδενική υπόθεση.
Οι αντιθέσεις βασίζονται στη σύγκριση των παρατηρούμενων συχνοτήτων (εμπειρικές συχνότητες) στο δείγμα με εκείνα που θα ήταν αναμενόμενα (θεωρητικές ή αναμενόμενες συχνότητες) εάν η μηδενική υπόθεση ήταν αληθής. Α) Ναι, η μηδενική υπόθεση απορρίπτεται εάν υπάρχει σημαντική διαφορά μεταξύ των παρατηρούμενων και των αναμενόμενων συχνοτήτων.
Λειτουργεί
Όπως έχουμε δει, η δοκιμή chi-square χρησιμοποιείται με δεδομένα που ανήκουν σε ονομαστική κλίμακα ή υψηλότερη. Από το τετράγωνο chi, δημιουργείται μια μηδενική υπόθεση που υποδηλώνει μια κατανομή πιθανότητας που καθορίζεται ως το μαθηματικό μοντέλο του πληθυσμού που έχει δημιουργήσει το δείγμα.
Μόλις έχουμε την υπόθεση, πρέπει να εκτελέσουμε την αντίθεση και για αυτό έχουμε τα δεδομένα σε έναν πίνακα συχνοτήτων. Η απόλυτη παρατηρούμενη ή εμπειρική συχνότητα υποδεικνύεται για κάθε τιμή ή εύρος τιμών. Στη συνέχεια, υποθέτοντας ότι η μηδενική υπόθεση είναι αληθής, για κάθε τιμή ή διάστημα τιμών υπολογίζεται η απόλυτη συχνότητα που θα ήταν αναμενόμενη ή αναμενόμενη.
Ερμηνεία
Η στατιστική chi-square θα λάβει τιμή ίση με 0 εάν υπάρχει τέλεια συμφωνία μεταξύ των παρατηρούμενων και των αναμενόμενων συχνοτήτων. από μειονεκτήματα, Η στατιστική θα λάβει μεγάλη τιμή εάν υπάρχει μεγάλη απόκλιση μεταξύ αυτών των συχνοτήτων, και κατά συνέπεια η μηδενική υπόθεση πρέπει να απορριφθεί.
Βιβλιογραφικές αναφορές:
- Λούμπιν, Ρ. Macià, A. Rubio de Lerma, P. (2005). Μαθηματική ψυχολογία I και II. Μαδρίτη: UNED.
- Pardo, A. Σαν Μαρτίν, Ρ. (2006). Ανάλυση δεδομένων στην ψυχολογία II. Μαδρίτη: Πυραμίδα.