Pearsons korrelationskoefficient: vad det är och hur man använder det
När man forskar inom psykologi används ofta beskrivande statistik, vilket erbjuder sätt att presentera och utvärdera de viktigaste egenskaperna hos datan genom tabeller, grafer och mått sammanfattningar.
I den här artikeln vi kommer att känna till Pearsons korrelationskoefficient, ett mått på beskrivande statistik. Det är ett linjärt mått mellan två kvantitativa slumpvariabler, som gör att vi kan veta intensiteten och riktningen för sambandet mellan dem.
- Relaterad artikel: "Cronbachs alfa (α): vad det är och hur det används i statistik"
beskrivande statistik
Pearson-korrelationskoefficienten är en typ av koefficient som används i beskrivande statistik. Specifikt, det används i beskrivande statistik som används för att studera två variabler.
Beskrivande statistik (även kallad explorativ dataanalys) för sin del samman en uppsättning tekniker Matematik utformad för att erhålla, organisera, presentera och beskriva en uppsättning data, i syfte att underlätta dess använda sig av. Använd i allmänhet tabeller, numeriska mått eller grafer som stöd.
Pearsons korrelationskoefficient: vad är den till för?
Pearson-korrelationskoefficienten används för att studera sambandet (eller korrelationen) mellan två kvantitativa slumpvariabler (minimiintervallskala); till exempel förhållandet mellan vikt och längd.
Det är en åtgärd som ger oss information om relationens intensitet och riktning. Det är med andra ord ett index som mäter graden av samvariation mellan olika linjärt relaterade variabler.
Vi måste vara tydliga med skillnaden mellan samband, korrelation eller samvariation mellan två variabler (= variabel gemensamma) och orsakssamband (även kallat prognoser, förutsägelse eller regression), eftersom de är olika begrepp.
- Du kanske är intresserad av: "Chi-kvadrattest (χ²): vad det är och hur det används i statistik"
Hur tolkas det?
Pearsons korrelationskoefficient inkluderar värden mellan -1 och +1. Alltså, beroende på dess värde, kommer det att ha en eller annan betydelse.
Om Pearsons korrelationskoefficient är lika med 1 eller -1 kan vi anse att den korrelation som finns mellan de studerade variablerna är perfekt.
Om koefficienten är större än 0 är korrelationen positiv ("A more, more, and a less less). Å andra sidan, om den är mindre än 0 (negativ), är korrelationen negativ ("A more, less, and a less, more). Slutligen, om koefficienten är lika med 0, kan vi bara bekräfta att det inte finns något linjärt samband mellan variablerna, utan det kan finnas någon annan typ av samband.
Överväganden
Pearson-korrelationskoefficienten ökar om variabiliteten för X och/eller Y (variablerna) ökar, och minskar annars. Å andra sidan, för att hävda om ett värde är högt eller lågt, vi måste jämföra våra uppgifter med andra utredningar med samma variabler och under liknande omständigheter.
För att representera sambanden mellan olika variabler som kombineras linjärt kan vi använda den så kallade varians-kovariansmatrisen eller korrelationsmatrisen; i diagonalen av den första hittar vi variansvärden, och i den andra hittar vi ettor (korrelationen av en variabel med sig själv är perfekt, =1).
kvadratisk koefficient
När vi kvadrerar Pearson-korrelationskoefficienten ändras dess betydelse, och vi tolkar dess värde i förhållande till prognoserna (indikerar kausalitet i sambandet). Det vill säga, i det här fallet kan det ha fyra tolkningar eller betydelser:
1. Associerad varians
Indikerar andelen av variansen av Y (en variabel) som är associerad med variationen av X (den andra variabeln). Därför kommer vi att veta att "1-kvadrat Pearson-koefficient" = "andel av variansen av Y som inte är associerad med variationen av X".
2. individuella skillnader
Om vi multiplicerar Pearson-korrelationskoefficienten x100, kommer det att indikera % av de individuella skillnaderna i Y som är associerade / beror på / förklaras av individuella variationer eller skillnader i X. Därför förklaras "1-kvadrat Pearson-koefficient x 100" = % av individuella skillnader i Y som inte är associerade med / beror på / av individuella variationer eller skillnader i X.
3. Felreduktionshastighet
Den kvadratiska Pearson-korrelationskoefficienten det kan också tolkas som ett index för minskningen av fel i prognoserna; det vill säga, det skulle vara andelen av rotmedelkvadratfelet som elimineras med Y' (regressionslinjen, konstruerad från resultaten) istället för medelvärdet av Y som prognosen. I detta fall skulle koefficienten x 100 också multipliceras (anger %).
Därför är "1-kvadrat Pearson-koefficient" = fel som fortfarande görs när man använder regressionslinjen istället för medelvärdet (alltid multiplicerat x 100 = anger %).
4. Poängapproximationsindex
Slutligen skulle den sista tolkningen av Pearson-korrelationskoefficienten upphöjd till kvadraten indikera approximationen av punkterna till den kommenterade regressionslinjen. Ju högre koefficientens värde (närmare 1), desto närmare kommer punkterna att vara Y' (vid linjen).
Bibliografiska referenser:
- Flaska, J. Suero, m. Ximenez, C. (2012). Dataanalys i psykologi I. Madrid: Pyramid.
- Lubin, P. Macia, A. Rubio de Lerma, P. (2005). Matematisk psykologi I och II. Madrid: UNED.
- Pardo, a. San Martin, R. (2006). Dataanalys i psykologi II. Madrid: Pyramid.