Pearsons korrelationskoefficient: hvad det er, og hvordan man bruger det
Når man forsker i psykologi, bruges der ofte beskrivende statistik, som tilbyder måder at præsentere og vurdere dataenes hovedkarakteristika gennem tabeller, grafer og mål resuméer.
I denne artikel vi kender Pearson-korrelationskoefficienten, et mål for beskrivende statistik. Det er et lineært mål mellem to kvantitative stokastiske variable, som giver os mulighed for at kende intensiteten og retningen af forholdet mellem dem.
- Relateret artikel: "Cronbachs alfa (α): hvad det er, og hvordan det bruges i statistik"
beskrivende statistik
Pearson-korrelationskoefficienten er en type koefficient, der bruges i beskrivende statistik. Specifikt, det bruges i beskrivende statistik anvendt til undersøgelse af to variable.
På sin side samler deskriptiv statistik (også kaldet eksplorativ dataanalyse) en række teknikker Matematik designet til at indhente, organisere, præsentere og beskrive et sæt data med det formål at lette det brug. Brug generelt tabeller, numeriske mål eller grafer som støtte.
Pearsons korrelationskoefficient: hvad er den til for?
Pearson korrelationskoefficienten bruges til at studere sammenhængen (eller korrelationen) mellem to kvantitative stokastiske variable (minimum interval skala); for eksempel forholdet mellem vægt og højde.
Det er en foranstaltning, der giver os information om intensiteten og retningen af forholdet. Det er med andre ord et indeks, der måler graden af samvariation mellem forskellige lineært relaterede variable.
Vi skal være klar over forskellen mellem sammenhæng, korrelation eller samvariation mellem to variable (= variabel fælles) og årsagssammenhæng (også kaldet prognose, forudsigelse eller regression), da de er forskellige begreber.
- Du kan være interesseret i: "Chi-square (χ²) test: hvad det er, og hvordan det bruges i statistik"
Hvordan tolkes det?
Pearsons korrelationskoefficient indeholder værdier mellem -1 og +1. Afhængigt af dets værdi vil det således have en eller anden betydning.
Hvis Pearson-korrelationskoefficienten er lig med 1 eller -1, kan vi overveje, at den korrelation, der eksisterer mellem de undersøgte variable, er perfekt.
Hvis koefficienten er større end 0, er korrelationen positiv ("A more, more, and a less less). På den anden side, hvis den er mindre end 0 (negativ), er korrelationen negativ ("A more, less, and a less, more). Endelig, hvis koefficienten er lig med 0, kan vi kun bekræfte, at der ikke er nogen lineær sammenhæng mellem variablerne, men der kan være en anden type sammenhæng.
Overvejelser
Pearson-korrelationskoefficienten stiger, hvis variabiliteten af X og/eller Y (variablerne) stiger, og falder ellers. På den anden side, for at fastslå, om en værdi er høj eller lav, vi skal sammenligne vores data med andre undersøgelser med de samme variabler og under lignende omstændigheder.
For at repræsentere sammenhængene mellem forskellige variabler, der kombinerer lineært, kan vi bruge den såkaldte varians-kovariansmatrix eller korrelationsmatricen; i diagonalen af den første finder vi variansværdier, og i den anden finder vi enere (korrelationen af en variabel med sig selv er perfekt, =1).
kvadratisk koefficient
Når vi kvadrerer Pearson-korrelationskoefficienten, ændres dens betydning, og vi fortolker dens værdi i forhold til prognoserne (angiver kausalitet af sammenhængen). Det vil sige, i dette tilfælde kan det have fire fortolkninger eller betydninger:
1. Associeret varians
Angiver andelen af variansen af Y (en variabel) forbundet med variationen af X (den anden variabel). Derfor vil vi vide, at "1-kvadrat Pearson-koefficient" = "andel af variansen af Y, der ikke er forbundet med variationen af X".
2. individuelle forskelle
Hvis vi multiplicerer Pearson-korrelationskoefficienten x100, vil det angive % af de individuelle forskelle i Y, der er forbundet / afhænger af / forklares ved individuelle variationer eller forskelle i X. Derfor er "1-kvadrat Pearson-koefficient x 100" = % af individuelle forskelle i Y, der ikke er forbundet med / afhænger af /, forklaret af individuelle variationer eller forskelle i X.
3. Fejlreduktionshastighed
Den kvadrerede Pearson-korrelationskoefficient det kan også tolkes som et indeks for reduktionen af fejl i prognoserne; det vil sige, at det ville være andelen af rodmiddelkvadratfejlen elimineret ved brug af Y' (regressionslinjen, konstrueret ud fra resultaterne) i stedet for middelværdien af Y som prognosen. I dette tilfælde ville koefficienten x 100 også blive ganget (angiver %).
Derfor er "1-kvadrat Pearson-koefficient" = fejl, der stadig er lavet, når du bruger regressionslinjen i stedet for middelværdien (altid ganget x 100 = angiver %).
4. Pointtilnærmelsesindeks
Endelig vil den sidste fortolkning af Pearson-korrelationskoefficienten hævet til kvadratet indikere tilnærmelsen af punkterne til den kommenterede regressionslinje. Jo højere værdien af koefficienten (tættere på 1), jo tættere vil punkterne være på Y' (på linjen).
Bibliografiske referencer:
- Flaske, J. Suero, m. Ximenez, C. (2012). Dataanalyse i psykologi I. Madrid: Pyramide.
- Lubin, P. Macia, A. Rubio de Lerma, P. (2005). Matematisk psykologi I og II. Madrid: UNED.
- Pardo, en. San Martin, R. (2006). Dataanalyse i psykologi II. Madrid: Pyramide.