Analyse af varians (ANOVA): hvad det er, og hvordan det bruges i statistik
I statistikker, når middelværdien af to eller flere prøver sammenlignes i forhold til en eller anden interesse (f.eks. Angst efter psykologisk behandling) bruges test til at afgøre, om der er signifikante forskelle mellem midlerne eller ej.
En af dem er variansanalysen (ANOVA). I denne artikel vil vi vide, hvad denne parametriske test består af, og hvilke antagelser der skal opfyldes for at bruge den.
- Relateret artikel: "Psykologi og statistik: betydningen af sandsynligheder i adfærdsvidenskab"
Analyse af varians (ANOVA): hvad er det?
I statistikken finder vi begrebet Analyse af varians (ANOVA), som består af en gruppering af statistiske modeller og deres tilknyttede procedurer, hvor variansen er opdelt i visse komponenterpå grund af forskellige forklarende variabler. Hvis vi nedbryder dets akronym på engelsk, står ANOVA for: ANalysis Of VAriance.
Analysen af varians (ANOVA) er en type parametrisk test. Dette betyder, at en række antagelser skal være opfyldt for at anvende den, og at niveauet for variablen af interesse skal være, i det mindste kvantitativ (dvs. mindst interval, for eksempel IQ, hvor der er et 0 i forhold).
Analyse af variansteknikker
Den første analyse af variansteknikker blev udviklet i 1920'erne og 1930'erne af R.A. Fisher, statistiker og genetiker. Derfor er variansanalysen (ANOVA) også kendt som "Fisher's Anova" eller "Fishers variansanalyse"; dette skyldes også brugen af Fishers F-distribution (en sandsynlighedsfordeling) som en del af hypotesetest.
Analyse af varians (ANOVA) stammer fra begreberne lineær regression. Lineær regression, i statistik, er en matematisk model, der bruges til at tilnærme afhængighedsforholdet mellem a afhængig variabel Y (for eksempel angst), de uafhængige variabler Xi (for eksempel forskellige behandlinger) og et udtryk tilfældig.
- Du kan være interesseret: "Normalfordeling: hvad det er, karakteristika og eksempler i statistikker"
Funktion af denne parametriske test
Således er en variansanalyse (ANOVA) tjener til at afgøre, om forskellige behandlinger (f.eks. psykologiske behandlinger) viser signifikante forskelle, eller hvis det tværtimod kan fastslås, at deres gennemsnitlige populationer ikke adskiller sig (de er praktisk talt de samme, eller deres forskel er ikke signifikant).
Dvs. ANOVA bruges til at teste hypoteser om gennemsnitlige forskelle (altid mere end to). ANOVA involverer en analyse eller nedbrydning af den samlede variation; dette kan til gengæld hovedsageligt tilskrives to variationskilder:
- Intergruppevariabilitet
- Intragruppens variabilitet eller fejl
Typer af ANOVA
Der er to typer variansanalyse (ANOVA):
1. Anova I
Når der kun er ét klassificeringskriterium (uafhængig variabel; for eksempel type terapeutisk teknik). Til gengæld kan det være intergruppe (der er flere eksperimentelle grupper) og intragrupper (der er en enkelt eksperimentel gruppe).
2. Anova II
I dette tilfælde er der mere end et klassificeringskriterium (uafhængig variabel). Som i det foregående tilfælde kan dette være intergruppe og intern gruppe.
Karakteristika og antagelser
Når variansanalysen (ANOVA) anvendes i eksperimentelle undersøgelser, består hver gruppe af et bestemt antal emner, og grupperne kan variere i dette antal. Når antallet af emner falder sammen, taler vi om en afbalanceret eller afbalanceret model.
I statistikken skal en række antagelser være opfyldt for at anvende variansanalysen (ANOVA):
1. Normal
Dette betyder, at score på den afhængige variabel (for eksempel angst) skal følge en normalfordeling. Denne antagelse det kontrolleres ved hjælp af de såkaldte test af godhed-af-pasform.
2. Uafhængighed
Det indebærer, at der ikke er nogen autokorrelation mellem scores, dvs. eksistensen af uafhængighed af scores fra hinanden. For at sikre overholdelse af denne antagelse, vi bliver nødt til at udføre en MAS (simpel tilfældig sampling) at vælge den prøve, som vi skal studere, eller som vi skal arbejde på.
3. Homocedasticitet
Det udtryk betyder "lighed med afvigelser fra delpopulationerne". Variansen er en statistik over variabilitet og spredning og øger jo større variationen eller spredningen af score er.
Antagelsen om homoscedasticitet verificeres ved hjælp af Levene- eller Bartlett-testen. Hvis dette ikke er opfyldt, er et andet alternativ at udføre en logaritmisk transformation af scores.
Andre antagelser
Ovenstående antagelser skal være opfyldt, når der anvendes varianteranalyse mellem grupper (ANOVA). Når man bruger en intern gruppe ANOVA, skal ovenstående antagelser og to yderligere imødekommes:
1. Sfæricitet
Hvis det ikke er opfyldt, ville det indikere, at de forskellige fejlkilder korrelerer med hinanden. En mulig løsning, hvis det sker, er at udføre en MANOVA (multivariat variansanalyse).
2. Additivitet
Det forudsætter intet emne x behandlingsinteraktion; hvis den ikke overholdes, vil fejlvariansen stige.
Bibliografiske referencer:
- Bottle, J., Sueró, M., Ximénez, C. (2012). Dataanalyse i psykologi I. Madrid: Pyramide.
- Fontes de Gracia, S. Garcia, C. Quintanilla, L. et al. (2010). Forskningsgrundlag i psykologi. Madrid.
- Martínez, M.A. Hernández, M.J. Hernández, M.V. (2014). Psykometri. Madrid: Alliance.