Variantieanalyse (ANOVA): wat het is en hoe het wordt gebruikt in statistieken
In statistieken, wanneer de gemiddelden van twee of meer steekproeven worden vergeleken in relatie tot een variabele van belang (bijvoorbeeld angstfor na psychologische behandeling), worden tests gebruikt om te bepalen of er significante verschillen zijn tussen de middelen.
Een daarvan is de variantieanalyse (ANOVA). In dit artikel zullen we weten waar deze parametrische test uit bestaat en aan welke aannames moet worden voldaan om deze te kunnen gebruiken.
- Gerelateerd artikel: "Psychologie en statistiek: het belang van waarschijnlijkheden in de gedragswetenschap"
Variantieanalyse (ANOVA): wat is het?
In de statistiek vinden we het concept Variantieanalyse (ANOVA), dat bestaat uit: een groepering van statistische modellen en de bijbehorende procedures, waarbij de variantie is opgedeeld in bepaalde componenten, vanwege verschillende verklarende variabelen. Als we het acroniem in het Engels opsplitsen, staat ANOVA voor: ANalysis Of VAriance.
De variantieanalyse (ANOVA) is: een soort parametrische test
. Dit betekent dat aan een reeks aannames moet worden voldaan om het toe te passen, en dat het niveau van de variabele van belang moet zijn, ten minste kwantitatief (d.w.z. ten minste een interval, bijvoorbeeld IQ, waar een 0. is familielid).Analyse van variantietechnieken
De eerste analyse van variantietechnieken werd in de jaren 1920 en 1930 ontwikkeld door R.A. Fisher, een statisticus en geneticus. Daarom is de variantieanalyse (ANOVA) ook bekend als "Fisher's Anova" of "Fisher's variantieanalyse"; dit komt ook door het gebruik van Fisher's F-verdeling (een kansverdeling) als onderdeel van het testen van hypothesen.
Variantieanalyse (ANOVA) komt voort uit de concepten van lineaire regressie. Lineaire regressie, in de statistiek, is een wiskundig model dat wordt gebruikt om de afhankelijkheidsrelatie tussen a. te benaderen afhankelijke variabele Y (bijvoorbeeld angst), de onafhankelijke variabelen Xi (bijvoorbeeld verschillende behandelingen) en een term willekeurig.
- Misschien ben je geïnteresseerd: "Normale verdeling: wat het is, kenmerken en voorbeelden in statistieken"
Functie van deze parametrische test
Dus een variantieanalyse (ANOVA) dient om te bepalen of verschillende behandelingen (bijv. psychologische behandelingen) significante verschillen vertonen, of als daarentegen kan worden vastgesteld dat hun gemiddelde populaties niet verschillen (ze zijn praktisch hetzelfde, of hun verschil is niet significant).
Met andere woorden, ANOVA wordt gebruikt om hypothesen over gemiddelde verschillen (altijd meer dan twee) te testen. ANOVA omvat een analyse of ontleding van de totale variabiliteit; dit kan op zijn beurt voornamelijk worden toegeschreven aan twee bronnen van variatie:
- Intergroepsvariabiliteit
- Variabiliteit of fout binnen de groep
Soorten ANOVA
Er zijn twee soorten variantieanalyse (ANOVA):
1. Anova I
Wanneer er slechts één classificatiecriterium is (onafhankelijke variabele; bijvoorbeeld type therapeutische techniek). Het kan op zijn beurt intergroep zijn (er zijn verschillende experimentele groepen) en intragroep (er is slechts één experimentele groep).
2. Anova II
In dit geval is er meer dan één classificatiecriterium (onafhankelijke variabele). Net als in het vorige geval kan dit intergroep en intragroep zijn.
Kenmerken en aannames
Wanneer de variantieanalyse (ANOVA) wordt toegepast in experimentele onderzoeken, bestaat elke groep uit een bepaald aantal proefpersonen en kunnen de groepen in dit aantal verschillen. Wanneer het aantal onderwerpen samenvalt, spreken we van een evenwichtig of evenwichtig model.
Om de variantieanalyse (ANOVA) toe te passen, moet in de statistiek aan een reeks aannames worden voldaan:
1. normaal
Dit betekent dat de scores op de afhankelijke variabele (bijvoorbeeld angst) een normale verdeling moeten volgen. deze veronderstelling het wordt gecontroleerd door middel van de zogenaamde goodness-of-fit tests.
2. Onafhankelijkheid
Het impliceert dat er geen autocorrelatie is tussen de scores, dat wil zeggen dat de scores onafhankelijk zijn van elkaar. Om aan deze veronderstelling te voldoen, we zullen een MAS moeten uitvoeren (simple random sampling) om de steekproef te selecteren die we gaan bestuderen of waaraan we gaan werken.
3. homocedasticiteit
die term betekent "gelijkheid van varianties van de subpopulaties". De variantie is een statistiek van variabiliteit en spreiding, en neemt toe naarmate de variabiliteit of spreiding van de scores groter is.
De aanname van homoscedasticiteit wordt geverifieerd met behulp van de Levene- of Bartlett-test. Indien hieraan niet wordt voldaan, is een ander alternatief het uitvoeren van een logaritmische transformatie van de scores.
andere veronderstellingen
Aan de bovenstaande veronderstellingen moet worden voldaan wanneer intergroepsanalyse van variantie (ANOVA) wordt gebruikt. Bij gebruik van een intragroep-ANOVA moet echter aan de bovenstaande veronderstellingen en nog twee worden voldaan:
1. Bolvormigheid
Als er niet aan wordt voldaan, zou dit erop wijzen dat de verschillende bronnen van fouten met elkaar correleren. Een mogelijke oplossing als dat gebeurt, is het uitvoeren van een MANOVA (Multivariate Variantieanalyse).
2. Additiviteit
Het veronderstelt geen interactie tussen subject x behandeling; als het wordt geschonden, zou de foutvariantie toenemen.
Bibliografische referenties:
- Fles, J., Sueró, M., Ximénez, C. (2012). Data-analyse in de psychologie I. Madrid: Piramide.
- Fontes de Gracia, S. Garcia, C. Quintanilla, L. et al. (2010). Onderzoeksgrondslagen in de psychologie. Madrid.
- Martinez, MA Hernández, M.J. Hernández, M.V. (2014). Psychometrie. Madrid: Alliantie.