Pearsons korrelasjonskoeffisient: hva det er og hvordan du bruker det
Når man forsker innen psykologi, brukes ofte beskrivende statistikk, som tilbyr måter å presentere og vurdere hovedkarakteristikkene til dataene gjennom tabeller, grafer og mål sammendrag.
I denne artikkelen vi vil kjenne Pearson-korrelasjonskoeffisienten, et mål på beskrivende statistikk. Det er et lineært mål mellom to kvantitative tilfeldige variabler, som lar oss vite intensiteten og retningen til forholdet mellom dem.
- Relatert artikkel: "Cronbachs alfa (α): hva det er og hvordan det brukes i statistikk"
beskrivende statistikk
Pearson-korrelasjonskoeffisienten er en type koeffisient som brukes i beskrivende statistikk. Nærmere bestemt, den brukes i beskrivende statistikk brukt til studiet av to variabler.
På sin side samler deskriptiv statistikk (også kalt utforskende dataanalyse) et sett med teknikker Matematikk designet for å innhente, organisere, presentere og beskrive et sett med data, med det formål å lette det bruk. Generelt, bruk tabeller, numeriske mål eller grafer som støtte.
Pearsons korrelasjonskoeffisient: hva er den til for?
Pearson-korrelasjonskoeffisienten brukes til å studere sammenhengen (eller korrelasjonen) mellom to kvantitative tilfeldige variabler (minimumsintervallskala); for eksempel forholdet mellom vekt og høyde.
Det er et tiltak som gir oss informasjon om intensiteten og retningen i forholdet. Det er med andre ord en indeks som måler graden av samvariasjon mellom ulike lineært relaterte variabler.
Vi må være tydelige på forskjellen mellom sammenheng, korrelasjon eller samvariasjon mellom to variabler (= variabel felles) og årsakssammenheng (også kalt prognose, prediksjon eller regresjon), siden de er forskjellige konsepter.
- Du kan være interessert i: "Chi-square (χ²) test: hva det er og hvordan det brukes i statistikk"
Hvordan tolkes det?
Pearsons korrelasjonskoeffisient inkluderer verdier mellom -1 og +1. Avhengig av verdien, vil den ha en eller annen betydning.
Hvis Pearson-korrelasjonskoeffisienten er lik 1 eller -1, kan vi vurdere at korrelasjonen som eksisterer mellom de studerte variablene er perfekt.
Hvis koeffisienten er større enn 0, er korrelasjonen positiv ("A more, more, and a less less). På den annen side, hvis den er mindre enn 0 (negativ), er korrelasjonen negativ ("A more, less, and a less, more). Til slutt, hvis koeffisienten er lik 0, kan vi bare bekrefte at det ikke er noen lineær sammenheng mellom variablene, men det kan være en annen type sammenheng.
Betraktninger
Pearson-korrelasjonskoeffisienten øker hvis variabiliteten til X og/eller Y (variablene) øker, og reduseres ellers. På den annen side, for å hevde om en verdi er høy eller lav, vi må sammenligne dataene våre med andre undersøkelser med de samme variablene og under lignende omstendigheter.
For å representere sammenhengene til ulike variabler som kombineres lineært, kan vi bruke den såkalte varians-kovariansmatrisen eller korrelasjonsmatrisen; i diagonalen til den første vil vi finne variansverdier, og i den andre vil vi finne enere (korrelasjonen til en variabel med seg selv er perfekt, =1).
kvadratisk koeffisient
Når vi kvadrerer Pearson-korrelasjonskoeffisienten, endres betydningen, og vi tolker dens verdi i forhold til prognosene (indikerer kausalitet av sammenhengen). Det vil si at i dette tilfellet kan det ha fire tolkninger eller betydninger:
1. Assosiert varians
Indikerer andelen av variansen til Y (en variabel) assosiert med variasjonen til X (den andre variabelen). Derfor vil vi vite at "1-kvadrat Pearson-koeffisient" = "andel av variansen til Y som ikke er assosiert med variasjonen til X".
2. individuelle forskjeller
Hvis vi multipliserer Pearson-korrelasjonskoeffisienten x100, vil det indikere % av de individuelle forskjellene i Y som er assosiert / avhenger av / forklares av individuelle variasjoner eller forskjeller i X. Derfor, "1-kvadrat Pearson koeffisient x 100" = % av individuelle forskjeller i Y som ikke er assosiert med / avhenger av / er forklart av individuelle variasjoner eller forskjeller i X.
3. Feilreduksjonsrate
Den kvadrerte Pearson-korrelasjonskoeffisienten det kan også tolkes som en indeks for reduksjon av feil i prognosene; det vil si at det vil være andelen av rotmiddelkvadratfeilen eliminert ved å bruke Y' (regresjonslinjen, konstruert fra resultatene) i stedet for gjennomsnittet av Y som prognosen. I dette tilfellet vil koeffisienten x 100 også multipliseres (indikerer %).
Derfor er "1-kvadrat Pearson-koeffisient" = feil som fortsatt gjøres når du bruker regresjonslinjen i stedet for gjennomsnittet (alltid multiplisert x 100 = indikerer %).
4. Poengtilnærmingsindeks
Til slutt vil den siste tolkningen av Pearson-korrelasjonskoeffisienten hevet til kvadratet indikere tilnærmingen av punktene til den kommenterte regresjonslinjen. Jo høyere verdi av koeffisienten (nærmere 1), jo nærmere vil punktene være Y' (til linjen).
Bibliografiske referanser:
- Flaske, J. Suero, m. Ximenez, C. (2012). Dataanalyse i psykologi I. Madrid: Pyramide.
- Lubin, P. Macia, A. Rubio de Lerma, P. (2005). Matematisk psykologi I og II. Madrid: UNED.
- Pardo, a. San Martin, R. (2006). Dataanalyse i psykologi II. Madrid: Pyramide.