Education, study and knowledge

Chi-square test (χ²): cos'è e come si usa in statistica

In statistica, ci sono vari test per analizzare la relazione tra le variabili. Le variabili nominali sono quelle che consentono relazioni di uguaglianza e disuguaglianza, come il genere.

In questo articolo conosceremo uno dei test per analizzare l'indipendenza tra variabili nominali o superiori: il test chi-quadrato, attraverso il test di ipotesi (Test di bontà di adattamento).

  • Articolo correlato: "Analisi della varianza (ANOVA): cos'è e come si usa in statistica"

Cos'è il test del chi quadrato?

Il test chi quadrato, chiamato anche chi quadrato (Χ2), rientra nei test relativi alla statistica descrittiva, nello specifico la statistica descrittiva applicata allo studio di due variabili. La statistica descrittiva, da parte sua, si concentra sull'estrazione di informazioni sul campione. Invece, le statistiche inferenziali estraggono informazioni sulla popolazione.

Il nome del test è tipico della distribuzione di probabilità Chi-quadrato su cui si basa. Questo test è stato sviluppato nel 1900 da Karl Pearson.

instagram story viewer

Il test chi-quadrato è uno dei più conosciuti e utilizzati per analizzare variabili nominali o qualitative, cioè per determinare l'esistenza o meno di indipendenza tra due variabili. Che due variabili siano indipendenti significa che non hanno alcuna relazione, e che quindi una non dipende dall'altra, né viceversa.

Così, con lo studio dell'indipendenza, nasce anche un metodo per verificare se le frequenze osservate in ciascuna categoria sono compatibili con l'indipendenza tra entrambe le variabili.

Come si ottiene l'indipendenza tra le variabili?

Per valutare l'indipendenza tra le variabili si calcolano i valori che indicherebbero l'indipendenza assoluta, che si chiama “frequenze attese”, confrontandole con le frequenze di campionamento.

Come al solito, l'ipotesi nulla (H0) indica che entrambe le variabili sono indipendenti, mentre l'ipotesi alternativa (H1) indica che le variabili hanno un certo grado di associazione o relazione.

Correlazione tra variabili

Quindi, come altri test per lo stesso scopo, il test chi-quadrato serve per vedere il senso della correlazione tra due variabili nominali o di livello superiore (Ad esempio, possiamo applicarlo se vogliamo sapere se esiste una relazione tra il sesso [essere un uomo o una donna] e la presenza di ansia [sì o no]).

Per determinare questo tipo di relazione esiste una tabella di frequenze da consultare (anche per altri test come il coefficiente Yule Q).

Se le frequenze empiriche e le frequenze teoriche o previste coincidono, allora non c'è relazione tra le variabili, cioè sono indipendenti. Se invece coincidono, non sono indipendenti (c'è una relazione tra le variabili, ad esempio tra X e Y).

Considerazioni

Il test chi quadrato, a differenza di altri test, non stabilisce restrizioni sul numero di modalità per variabile, e, non è necessario che il numero di righe e il numero di colonne nelle tabelle corrispondano.

Tuttavia, è necessario che venga applicato a studi basati su campioni indipendenti e quando tutti i valori attesi sono maggiori di 5. Come abbiamo già accennato, i valori attesi sono quelli che indicano l'assoluta indipendenza tra entrambe le variabili.

Inoltre, per utilizzare il test chi-quadrato, il livello di misurazione deve essere nominale o superiore. Non ha un limite superiore, cioè non ci permette di conoscere l'intensità della correlazione. In altre parole, il chi quadrato assume valori compresi tra 0 e infinito.

D'altra parte, se il campione aumenta, il valore del chi quadrato aumenta, ma bisogna essere cauti nella sua interpretazione, perché ciò non significa che ci sia più correlazione.

Distribuzione chi-quadrato

Il test del chi quadrato usa un'approssimazione alla distribuzione del chi quadrato valutare la probabilità di una discrepanza uguale o maggiore di quella esistente tra i dati e le frequenze attese secondo l'ipotesi nulla.

L'accuratezza di questa valutazione dipenderà dal fatto che i valori attesi non siano molto piccoli, e in misura minore dal fatto che il contrasto tra loro non sia molto elevato.

Correzione Yates

La correzione di Yates è una formula matematica che si applica con tabelle 2x2 e con una piccola frequenza teorica (minore di 10), per correggere gli eventuali errori del test chi-quadro.

In genere viene applicata la correzione di Yates o "correzione di continuità". quando una variabile discreta approssima una distribuzione continua.

Ipotesi contrasto

Inoltre, il test del chi quadrato appartiene ai cosiddetti test di bontà di adattamento o contrasti, che hanno l'obiettivo di decidere se l'ipotesi che un dato campione provenga da una popolazione con una distribuzione di probabilità completamente specificata nell'ipotesi nulla possa essere accettata.

I contrasti si basano sul confronto delle frequenze osservate (frequenze empiriche) nel campione con quelle che ci si aspetterebbe (frequenze teoriche o attese) se l'ipotesi nulla fosse vero. R) Sì, l'ipotesi nulla è respinta se c'è una differenza significativa tra le frequenze osservate e quelle previste.

Funzionamento

Come abbiamo visto, il test chi-quadrato viene utilizzato con dati appartenenti a una scala nominale o superiore. Dal chi-quadrato si stabilisce un'ipotesi nulla che postula una distribuzione di probabilità specificata come modello matematico della popolazione che ha generato il campione.

Una volta che abbiamo l'ipotesi, dobbiamo eseguire il contrasto, e per questo abbiamo i dati in una tabella di frequenza. Per ogni valore o intervallo di valori è indicata la frequenza assoluta osservata o empirica. Quindi, supponendo che l'ipotesi nulla sia vera, per ogni valore o intervallo di valori viene calcolata la frequenza assoluta che ci si aspetterebbe o la frequenza attesa.

Interpretazione

La statistica chi-quadrato assumerà un valore pari a 0 se c'è un perfetto accordo tra le frequenze osservate e quelle attese; per contro, la statistica assumerà un valore grande se c'è una grande discrepanza tra queste frequenze, e di conseguenza l'ipotesi nulla deve essere respinta.

Riferimenti bibliografici:

  • Lubin, P. Macia, A. Rubio de Lerma, P. (2005). Psicologia matematica I e II. Madrid: UNED.
  • Pardo, A. San Martino, R. (2006). Analisi dei dati in psicologia II. Madrid: piramide.

Filogenesi e ontogenesi: cosa sono e come si differenziano

Filogenesi e ontogenesi sono due parole che spesso compaiono insieme, il che fa pensare, in più d...

Leggi di più

Gli 11 tipi di reazioni chimiche

Le diverse sostanze presenti in natura interagiscono tra loro continuamente. Cose comuni come acc...

Leggi di più

Le 15 proprietà fisiche e chimiche dell'acqua

L'acqua è senza dubbio uno degli elementi più importanti per noi, al punto che tutte le forme di ...

Leggi di più