Коефициент на корелация на Пиърсън: какво е това и как да го използвате
При изследвания в психологията често се използва описателна статистика, която предлага начини за представят и оценяват основните характеристики на данните чрез таблици, графики и мерки резюмета.
В тази статия ще знаем коефициента на корелация на Пиърсън, мярка за описателна статистика. Това е линейна мярка между две количествени случайни променливи, която ни позволява да знаем интензитета и посоката на връзката между тях.
- Свързана статия: "Алфа (α) на Кронбах: какво представлява и как се използва в статистиката"
Описателна статистика
Коефициентът на корелация на Пиърсън е вид коефициент, използван в описателната статистика. по-конкретно, използва се в описателна статистика, прилагана за изследване на две променливи.
От своя страна описателната статистика (наричана още проучвателен анализ на данни) обединява набор от техники Математика, предназначена да получи, организира, представи и опише набор от данни, с цел да ги улесни използване. Като цяло използвайте таблици, числени мерки или графики като опора.
Корелационен коефициент на Пиърсън: за какво е?
Корелационният коефициент на Пиърсън се използва за изследване на връзката (или корелацията) между две количествени случайни променливи (минимална интервална скала); например връзката между тегло и височина.
Това е мярка, която ни дава информация за интензитета и посоката на връзката. С други думи, това е индекс, който измерва степента на ковариация между различни линейно свързани променливи.
Трябва да сме наясно с разликата между връзката, корелацията или ковариацията между две променливи (= променлива съвместно) и причинно-следствена връзка (наричана още прогнозиране, прогнозиране или регресия), тъй като те са различни понятия.
- Може да се интересувате от: "Хи-квадрат (χ²) тест: какво представлява и как се използва в статистиката"
Как се тълкува?
Коефициент на корелация на Пиърсън включва стойности между -1 и +1. Така в зависимост от стойността си, той ще има едно или друго значение.
Ако коефициентът на корелация на Pearson е равен на 1 или -1, можем да считаме, че корелацията, която съществува между изследваните променливи, е перфектна.
Ако коефициентът е по-голям от 0, корелацията е положителна („повече, повече и по-малко по-малко). От друга страна, ако е по-малко от 0 (отрицателна), корелацията е отрицателна („Повече, по-малко и по-малко, повече). И накрая, ако коефициентът е равен на 0, можем само да потвърдим, че няма линейна връзка между променливите, но може да има някакъв друг тип връзка.
Съображения
Коефициентът на корелация на Пиърсън се увеличава, ако променливостта на X и/или Y (променливите) се увеличава, и намалява в противен случай. От друга страна, за да се твърди дали дадена стойност е висока или ниска, трябва да сравним нашите данни с други изследвания със същите променливи и при подобни обстоятелства.
За да представим връзките на различни променливи, които се комбинират линейно, можем да използваме така наречената дисперсионно-ковариационна матрица или корелационната матрица; в диагонала на първия ще намерим стойности на дисперсията, а във втория ще намерим единици (корелацията на променлива със самата себе си е идеална, =1).
квадратен коефициент
Когато повдигнем на квадрат корелационния коефициент на Пиърсън, значението му се променя, и ние интерпретираме стойността му във връзка с прогнозите (показва причинно-следствената връзка на връзката). Тоест в този случай може да има четири интерпретации или значения:
1. Свързана дисперсия
Показва съотношението на вариацията на Y (една променлива), свързана с вариацията на X (другата променлива). Следователно ще знаем, че "1-квадрат коефициент на Пиърсън" = "пропорция на дисперсията на Y, която не е свързана с вариацията на X".
2. индивидуални различия
Ако умножим коефициента на корелация на Pearson x100, той ще покаже % от индивидуалните разлики в Y, които са свързани / зависят от / се обясняват с индивидуални вариации или разлики в X. Следователно „1-квадрат коефициент на Пиърсън x 100“ = % от индивидуалните разлики в Y, които не са свързани с/зависят от/, се обясняват с индивидуални вариации или разлики в X.
3. Процент на намаляване на грешките
Коефициентът на корелация на Пиърсън на квадрат може да се интерпретира и като индекс за намаляване на грешките в прогнозите; това ще бъде пропорцията на средната квадратична грешка, елиминирана с помощта на Y' (регресионната линия, конструирана от резултатите) вместо средната стойност на Y като прогноза. В този случай коефициентът x 100 също ще бъде умножен (показва %).
Следователно „1-квадрат коефициент на Пиърсън“ = грешка, която все още се допуска при използване на регресионната линия вместо средната стойност (винаги умножено по 100 = показва %).
4. Индекс на приближение на точки
И накрая, последната интерпретация на коефициента на корелация на Pearson, повдигната на квадрат, би посочила приближаването на точките към коментираната регресионна линия. Колкото по-висока е стойността на коефициента (по-близо до 1), толкова по-близо ще бъдат точките до Y' (до линията).
Библиографски справки:
- Бутилка, Дж. Суеро, м. Хименес, К. (2012). Анализ на данни в психологията I. Мадрид: Пирамида.
- Любин, П. Масия, А. Рубио де Лерма, П. (2005). Математическа психология I и II. Мадрид: UNED.
- Пардо, а. Сан Мартин, Р. (2006). Анализ на данни в психологията II. Мадрид: Пирамида.