Анализ на дисперсията (ANOVA): какво е и как се използва в статистиката
В статистиката, когато средните стойности на две или повече проби се сравняват по отношение на някаква интересна променлива (например тревожност след психологично лечение) се използват тестове, за да се определи дали има значителни разлики между средствата.
Един от тях е анализът на дисперсията (ANOVA). В тази статия ще знаем от какво се състои този параметричен тест и какви предположения трябва да бъдат изпълнени, за да го използваме.
- Свързана статия: "Психология и статистика: значението на вероятностите в поведенческите науки"
Анализ на дисперсията (ANOVA): какво е това?
В статистиката откриваме концепцията за дисперсионния анализ (ANOVA), която се състои от групиране на статистически модели и свързаните с тях процедури, където дисперсията е разделена на определени компоненти, поради различни обяснителни променливи. Ако разделим съкращението му на английски, ANOVA означава: ANalysis Of VAriance.
Анализът на дисперсията (ANOVA) е вид параметричен тест. Това означава, че трябва да се изпълнят поредица от предположения, за да се приложи, и че нивото на променливата от интерес трябва да бъде, поне количествено (т.е. поне интервал, например IQ, където има 0 относително).
Анализ на дисперсионните техники
Първият анализ на вариационните техники е разработен през 20-те и 30-те години от R.A. Фишър, статистик и генетик. Ето защо дисперсионният анализ (ANOVA) известен също като "Anova на Fisher" или "Variance анализ на Fisher"; това се дължи и на използването на F-разпределението на Fisher (разпределение на вероятността) като част от тестването на хипотези.
Дисперсионен анализ (ANOVA) произтича от концепциите за линейна регресия. Линейната регресия в статистиката е математически модел, който се използва за приближаване на зависимостта на зависимостта между a зависима променлива Y (например безпокойство), независимите променливи Xi (например различни лечения) и термин случайни.
- Може да се интересувате: "Нормално разпределение: какво представлява, характеристики и примери в статистиката"
Функция на този параметричен тест
По този начин, анализ на дисперсията (ANOVA) служи за определяне дали различните лечения (например психологични лечения) показват значителни разлики, или ако, напротив, може да се установи, че средните им популации не се различават (те са практически еднакви или разликата им не е значителна).
С други думи, ANOVA се използва за тестване на хипотези за средните разлики (винаги повече от две). ANOVA включва анализ или разлагане на общата променливост; това от своя страна може да се отдаде главно на два източника на вариации:
- Междугрупова променливост
- Вътрешногрупова променливост или грешка
Видове ANOVA
Има два типа вариационен анализ (ANOVA):
1. Anova I
Когато има само един критерий за класификация (независима променлива; например вид терапевтична техника). На свой ред тя може да бъде междугрупова (има няколко експериментални групи) и вътрешногрупова (има само една експериментална група).
2. Anova II
В този случай има повече от един критерий за класификация (независима променлива). Както в предишния случай, това може да бъде междугрупово и вътрешногрупово.
Характеристики и предположения
Когато дисперсионният анализ (ANOVA) се прилага в експериментални изследвания, всяка група се състои от определен брой субекти и групите могат да се различават в този брой. Когато броят на предметите съвпада, говорим за балансиран или балансиран модел.
В статистиката, за да се приложи дисперсионният анализ (ANOVA), трябва да бъдат изпълнени поредица от предположения:
1. Нормално
Това означава, че оценките на зависимата променлива (например тревожност) трябва да следват нормално разпределение. Това предположение проверява се с помощта на така наречените тестове за пригодност.
2. Независимост
Това предполага, че няма автокорелация между оценките, тоест съществуването на независимост на резултатите един от друг. За да се гарантира спазването на това предположение, ще трябва да извършим MAS (просто произволно вземане на проби) за да изберем извадката, която ще изучаваме или върху която ще работим.
3. Хомодедастичност
Този термин означава "равенство на дисперсиите на субпопулациите". Дисперсията е статистика на променливостта и дисперсията и увеличава колкото по-голяма е променливостта или дисперсията на резултатите.
Предполагането за хомоскедастичност се проверява с помощта на теста на Levene или Bartlett. В случай на неизпълнение, друга алтернатива е да се извърши логаритмична трансформация на резултатите.
Други предположения
Горните предположения трябва да бъдат изпълнени, когато се използва вариационен междугрупов анализ (ANOVA). Когато обаче се използва вътрешногрупова ANOVA, горните предположения и още две трябва да бъдат изпълнени:
1. Сферичност
Ако не е изпълнено, това означава, че различните източници на грешки корелират помежду си. Възможно решение, ако това се случи, е да се извърши MANOVA (многовариатен анализ на вариацията).
2. Адитивност
Предполага липса на взаимодействие между субект и лечение; ако не се спазва, вариацията на грешката ще се увеличи.
Библиографски справки:
- Бутилка, J., Sueró, М., Ximénez, C. (2012). Анализ на данните в психологията I. Мадрид: Пирамида.
- Фонтес де Грация, С. Гарсия, С. Кинтанила, Л. и др. (2010). Основи на изследванията в психологията. Мадрид.
- Мартинес, М.А. Hernández, M.J. Ернандес, М.В. (2014). Психометрия. Мадрид: Алианс.