Współczynnik korelacji Pearsona: co to jest i jak go używać
Podczas badań w psychologii często stosuje się statystyki opisowe, które oferują sposoby przedstawiać i oceniać główne cechy danych za pomocą tabel, wykresów i miar streszczenia.
W tym artykule poznamy współczynnik korelacji Pearsona, miara statystyki opisowej. Jest to liniowa miara między dwiema ilościowymi zmiennymi losowymi, która pozwala nam poznać intensywność i kierunek zależności między nimi.
- Powiązany artykuł: „Alfa Cronbacha (α): czym jest i jak jest wykorzystywana w statystyce"
opisowe statystyki
Współczynnik korelacji Pearsona jest rodzajem współczynnika stosowanego w statystyce opisowej. Konkretnie, jest używany w statystyce opisowej stosowanej do badania dwóch zmiennych.
Ze swojej strony statystyka opisowa (zwana także eksploracyjną analizą danych) łączy zestaw technik Matematyka przeznaczona do uzyskiwania, organizowania, prezentowania i opisywania zestawu danych w celu ułatwienia ich używać. Ogólnie rzecz biorąc, używaj tabel, miar liczbowych lub wykresów jako wsparcia.
Współczynnik korelacji Pearsona: do czego służy?
Współczynnik korelacji Pearsona służy do badania związku (lub korelacji) między dwiema ilościowymi zmiennymi losowymi (skala minimalnego przedziału); na przykład związek między wagą a wzrostem.
Jest to miara dostarcza nam informacji o intensywności i kierunku relacji. Innymi słowy, jest to wskaźnik, który mierzy stopień kowariancji między różnymi liniowo powiązanymi zmiennymi.
Musimy mieć jasność co do różnicy między zależnością, korelacją lub współzmiennością między dwiema zmiennymi (= zmienna wspólne) i związek przyczynowy (zwany także prognozowaniem, przewidywaniem lub regresją), ponieważ są to różne koncepcje.
- Możesz być zainteresowany: "Test chi-kwadrat (χ²): co to jest i jak jest używany w statystyce"
Jak to jest interpretowane?
Współczynnik korelacji Pearsona zawiera wartości między -1 a +1. Tak więc, w zależności od jego wartości, będzie miał takie lub inne znaczenie.
Jeśli współczynnik korelacji Pearsona jest równy 1 lub -1, możemy uznać, że korelacja istniejąca między badanymi zmiennymi jest doskonała.
Jeśli współczynnik jest większy od 0, korelacja jest dodatnia („A więcej, więcej i mniej mniej). Z drugiej strony, jeśli jest mniejsza niż 0 (ujemna), korelacja jest ujemna („A więcej, mniej i mniej, więcej). Wreszcie, jeśli współczynnik jest równy 0, możemy jedynie stwierdzić, że nie ma zależności liniowej między zmiennymi, ale może istnieć jakiś inny rodzaj zależności.
Rozważania
Współczynnik korelacji Pearsona rośnie, jeśli zmienność X i/lub Y (zmienne) wzrasta, aw przeciwnym razie maleje. Z drugiej strony, aby stwierdzić, czy wartość jest wysoka, czy niska, musimy porównać nasze dane z innymi badaniami z tymi samymi zmiennymi iw podobnych okolicznościach.
Aby przedstawić relacje różnych zmiennych, które łączą się liniowo, możemy użyć tak zwanej macierzy wariancji-kowariancji lub macierzy korelacji; na przekątnej pierwszej znajdziemy wartości wariancji, a na drugiej je (korelacja zmiennej z samą sobą jest doskonała, =1).
kwadratowy współczynnik
Kiedy podniesiemy współczynnik korelacji Pearsona do kwadratu, jego znaczenie się zmieni, a jego wartość interpretujemy w odniesieniu do prognoz (wskazuje na przyczynowość związku). Oznacza to, że w tym przypadku może mieć cztery interpretacje lub znaczenia:
1. Powiązana wariancja
Wskazuje proporcję wariancji Y (jednej zmiennej) związanej ze zmiennością X (druga zmienna). Dlatego będziemy wiedzieć, że „1-kwadratowy współczynnik Pearsona” = „część wariancji Y, która nie jest związana ze zmiennością X”.
2. różnice indywidualne
Jeśli pomnożymy współczynnik korelacji Pearsona x100, wskaże on procent poszczególnych różnic w Y, które są powiązane / zależne od / są wyjaśnione indywidualnymi odmianami lub różnicami w X. Dlatego „1-kwadratowy współczynnik Pearsona x 100” = % indywidualnych różnic w Y, które nie są związane z / zależą od / są wyjaśnione przez indywidualne zmiany lub różnice w X.
3. Szybkość redukcji błędów
Kwadrat współczynnika korelacji Pearsona można go również interpretować jako wskaźnik redukcji błędu prognoz; to znaczy, byłaby to część błędu średniokwadratowego wyeliminowana przy użyciu Y' (linia regresji zbudowana z wyników) zamiast średniej Y jako prognozy. W tym przypadku współczynnik x 100 również zostałby pomnożony (wskazuje %).
Dlatego „1-kwadratowy współczynnik Pearsona” = błąd, który jest nadal popełniany przy użyciu linii regresji zamiast średniej (zawsze pomnożony x 100 = wskazuje %).
4. Wskaźnik aproksymacji punktów
Wreszcie ostatnia interpretacja współczynnika korelacji Pearsona podniesiona do kwadratu wskazywałaby na przybliżenie punktów do komentowanej linii regresji. Im wyższa wartość współczynnika (bliższa 1), tym punkty będą bliżej Y' (linii).
Odniesienia bibliograficzne:
- Butelka, j. Suero, m. Ximenez, C. (2012). Analiza danych w psychologii I. Madryt: Piramida.
- Lubin, p. Macia, A. Rubio de Lerma, P. (2005). Psychologia matematyczna I i II. Madryt: UNED.
- Pardo, a. San Marcin, r. (2006). Analiza danych w psychologii II. Madryt: Piramida.