Коефіцієнт кореляції Пірсона: що це таке і як ним користуватися
Під час досліджень у психології часто використовується описова статистика, яка пропонує способи представити та оцінити основні характеристики даних за допомогою таблиць, графіків і показників резюме.
У цій статті ми будемо знати коефіцієнт кореляції Пірсона, міра описової статистики. Це лінійна міра між двома кількісними випадковими змінними, яка дозволяє нам знати інтенсивність і напрямок зв’язку між ними.
- Пов'язана стаття: "Альфа Кронбаха (α): що це таке і як використовується в статистиці"
описова статистика
Коефіцієнт кореляції Пірсона — це тип коефіцієнта, який використовується в описовій статистиці. Зокрема, він використовується в описовій статистиці, що застосовується до вивчення двох змінних.
Зі свого боку описова статистика (її також називають пошуковим аналізом даних) об’єднує набір методів Математика, призначена для отримання, організації, представлення та опису набору даних з метою полегшення його використовувати. Загалом використовуйте таблиці, числові показники або графіки як опору.
Коефіцієнт кореляції Пірсона: для чого він потрібен?
Коефіцієнт кореляції Пірсона використовується для вивчення зв'язку (або кореляції) між двома кількісними випадковими величинами (шкала мінімального інтервалу); наприклад, співвідношення між вагою і зростом.
Це міра, яка дає нам інформацію про інтенсивність і напрямок відносин. Іншими словами, це індекс, який вимірює ступінь коваріації між різними лінійно пов’язаними змінними.
Ми повинні чітко розуміти різницю між зв'язком, кореляцією або коваріацією між двома змінними (= змінна спільний) і причинно-наслідковий зв’язок (також званий прогнозуванням, передбаченням або регресією), оскільки це різні поняття.
- Вас може зацікавити: "Критерій хі-квадрат (χ²): що це таке і як він використовується в статистиці"
Як це трактується?
Коефіцієнт кореляції Пірсона включає значення від -1 до +1. Таким чином, залежно від його значення, воно матиме те чи інше значення.
Якщо коефіцієнт кореляції Пірсона дорівнює 1 або -1, ми можемо вважати, що кореляція, яка існує між досліджуваними змінними, ідеальна.
Якщо коефіцієнт більший за 0, кореляція позитивна («Більше, більше, а менше менше). З іншого боку, якщо він менший за 0 (негативний), кореляція є негативною («Більше, менше, і менше, більше). Нарешті, якщо коефіцієнт дорівнює 0, ми можемо лише стверджувати, що між змінними немає лінійного зв’язку, але може бути якийсь інший тип зв’язку.
міркування
Коефіцієнт кореляції Пірсона збільшується, якщо мінливість X і/або Y (змінних) збільшується, і зменшується в іншому випадку. З іншого боку, щоб стверджувати, чи є значення високим чи низьким, ми повинні порівняти наші дані з іншими дослідженнями з тими самими змінними та за подібних обставин.
Для представлення зв’язків різних змінних, які поєднуються лінійно, ми можемо використовувати так звану дисперсійно-коваріаційну матрицю або кореляційну матрицю; по діагоналі першого знайдемо значення дисперсії, а по другому – одиниці (кореляція змінної сама з собою ідеальна, =1).
квадратний коефіцієнт
Коли ми зводимо коефіцієнт кореляції Пірсона, його значення змінюється, і ми інтерпретуємо його значення по відношенню до прогнозів (вказує на причинно-наслідковий зв’язок). Тобто в даному випадку воно може мати чотири тлумачення або значення:
1. Пов'язана дисперсія
Вказує частку дисперсії Y (однієї змінної), пов’язаної з варіацією X (іншої змінної). Таким чином, ми знаємо, що «1-квадратний коефіцієнт Пірсона» = «частка дисперсії Y, яка не пов’язана з варіацією X».
2. індивідуальні відмінності
Якщо ми помножимо коефіцієнт кореляції Пірсона на 100, це вкаже % індивідуальних відмінностей у Y, які пов’язані / залежать від / пояснюються індивідуальними варіаціями або відмінностями в X. Таким чином, «1-квадратний коефіцієнт Пірсона x 100» = % індивідуальних відмінностей у Y, які не пов’язані з / залежать від /, пояснюється індивідуальними варіаціями або відмінностями в X.
3. Швидкість зменшення помилок
Квадрат коефіцієнта кореляції Пірсона його також можна інтерпретувати як індекс зменшення похибки в прогнозах; тобто це буде частка середньоквадратичної помилки, виключеної за допомогою Y' (лінії регресії, побудованої за результатами) замість середнього значення Y як прогнозу. У цьому випадку коефіцієнт x 100 також буде помножено (вказує на %).
Таким чином, «коефіцієнт Пірсона в 1 квадраті» = помилка, яка все ще виникає при використанні лінії регресії замість середнього (завжди помножене на 100 = вказує на %).
4. Індекс апроксимації балів
Нарешті, остання інтерпретація коефіцієнта кореляції Пірсона, зведена в квадрат, вказувала б на наближення точок до коментованої лінії регресії. Чим вище значення коефіцієнта (ближче до 1), тим ближче точки будуть до Y' (до лінії).
Бібліографічні посилання:
- Пляшка, Дж. Суеро, м. Хіменес, К. (2012). Аналіз даних у психології І. Мадрид: Піраміда.
- Лубін, П. Масія, А. Рубіо де Лерма, П. (2005). Математична психологія I і II. Мадрид: UNED.
- Пардо, а. Сан Мартін, Р. (2006). Аналіз даних у психології II. Мадрид: Піраміда.