Analýza odchylky (ANOVA): co to je a jak se používá ve statistikách
Ve statistikách, když jsou prostředky dvou nebo více vzorků porovnávány ve vztahu k nějaké proměnné zájmu (například úzkost po psychologické léčbě) se testy používají k určení, zda existují významné rozdíly mezi prostředky.
Jedním z nich je analýza rozptylu (ANOVA). V tomto článku budeme vědět, z čeho se tento parametrický test skládá a jaké předpoklady musí být splněny, aby bylo možné jej použít.
- Související článek: „Psychologie a statistika: význam pravděpodobností ve vědě o chování"
Analýza rozptylu (ANOVA): co to je?
Ve statistice najdeme koncept analýzy rozptylu (ANOVA), který se skládá z seskupení statistických modelů a souvisejících postupů, kde je rozptyl rozdělen na určité komponenty, kvůli různým vysvětlujícím proměnným. Pokud rozložíme jeho zkratku v angličtině, znamená ANOVA: ANalysis Of VAriance.
Analýza rozptylu (ANOVA) je typ parametrického testu. To znamená, že k jeho aplikaci musí být splněna řada předpokladů a že úroveň proměnné zájmu musí být, alespoň kvantitativní (tj. alespoň interval, například IQ, kde je 0 relativní).
Analýza variačních technik
První analýza variačních technik byla vyvinuta ve 20. a 30. letech R.A. Fisher, statistik a genetik. Proto je analýza rozptylu (ANOVA) také známý jako „Fisherova Anova“ nebo „Fisherova analýza rozptylu“; to je také způsobeno použitím Fisherovy F distribuce (rozdělení pravděpodobnosti) jako součást testování hypotéz.
Analýza rozptylu (ANOVA) vyplývá z konceptů lineární regrese. Lineární regrese ve statistikách je matematický model, který se používá k aproximaci vztahu závislostí mezi a závislá proměnná Y (například úzkost), nezávislé proměnné Xi (například různá léčba) a termín náhodný.
- Mohlo by vás zajímat: "Normální rozdělení: co to je, charakteristika a příklady ve statistice"
Funkce tohoto parametrického testu
Analýza rozptylu (ANOVA) slouží k určení, zda různé způsoby léčby (např. psychologické léčby) vykazují významné rozdíly, nebo pokud naopak lze prokázat, že se jejich průměrné populace neliší (jsou prakticky stejné, nebo jejich rozdíl není významný).
Jinými slovy, ANOVA se používá k testování hypotéz o průměrných rozdílech (vždy více než dvou). ANOVA zahrnuje analýzu nebo rozklad celkové variability; to lze připsat hlavně dvěma zdrojům variací:
- Variabilita mezi skupinami
- Variabilita nebo chyba uvnitř skupiny
Typy ANOVA
Existují dva typy analýzy rozptylu (ANOVA):
1. Anova I.
Pokud existuje pouze jedno klasifikační kritérium (nezávislá proměnná; například typ terapeutické techniky). Na druhé straně to může být intergroup (existuje několik experimentálních skupin) a intragroup (existuje pouze jedna experimentální skupina).
2. Anova II
V tomto případě existuje více než jedno klasifikační kritérium (nezávislá proměnná). Stejně jako v předchozím případě to může být meziskupina a vnitroskupina.
Charakteristika a předpoklady
Pokud se při experimentálních studiích použije analýza rozptylu (ANOVA), každá skupina se skládá z určitého počtu subjektů a skupiny se mohou v tomto počtu lišit. Když se počet předmětů shoduje, mluvíme o vyváženém nebo vyváženém modelu.
Ve statistice je pro použití analýzy rozptylu (ANOVA) nutné splnit řadu předpokladů:
1. Normální
To znamená, že skóre závislé proměnné (například úzkosti) musí následovat normální rozdělení. Tento předpoklad kontroluje se pomocí takzvaných testů dobré shody.
2. Nezávislost
Znamená to, že mezi skóre neexistuje autokorelace, to znamená existence nezávislosti skóre na sobě navzájem. Aby byl zajištěn soulad s tímto předpokladem, budeme muset provést MAS (jednoduché náhodné vzorkování) vybrat vzorek, který budeme studovat nebo na kterém budeme pracovat.
3. Homocedasticita
Ten termín znamená „rovnost odchylek subpopulací“. Rozptyl je statistika variability a rozptylu a zvyšuje se tím, čím větší je variabilita nebo rozptyl skóre.
Předpoklad homoscedasticity je ověřen pomocí Levenova nebo Bartlettova testu. V případě jeho nesplnění je další alternativou provedení logaritmické transformace skóre.
Další předpoklady
Výše uvedené předpoklady musí být splněny, pokud je použita meziskupinová analýza rozptylu (ANOVA). Při použití intraskupinové ANOVA však musí být splněny výše uvedené předpoklady a další dva:
1. Sférickost
Pokud není splněn, znamenalo by to, že různé zdroje chyb spolu korelují. Možným řešením, pokud k tomu dojde, je provedení MANOVA (Multivariate Analysis of Variance).
2. Aditivita
Nepředpokládá žádnou interakci subjektu x léčby; pokud není dodržena, odchylka chyby by se zvýšila.
Bibliografické odkazy:
- Bottle, J., Sueró, M., Ximénez, C. (2012). Analýza dat v psychologii I. Madrid: Pyramida.
- Fontes de Gracia, S. Garcia, C. Quintanilla, L. et al. (2010). Základy výzkumu v psychologii. Madrid.
- Martínez, M.A. Hernández, M.J. Hernández, M.V. (2014). Psychometrie. Madrid: Aliance.