Education, study and knowledge

Coefficient de corrélation de Pearson: qu'est-ce que c'est et comment l'utiliser

Dans les recherches en psychologie, les statistiques descriptives sont fréquemment utilisées, ce qui offre des moyens de présenter et évaluer les principales caractéristiques des données à travers des tableaux, des graphiques et des mesures résumés.

Dans cet article nous connaîtrons le coefficient de corrélation de Pearson, une mesure de statistiques descriptives. C'est une mesure linéaire entre deux variables aléatoires quantitatives, ce qui nous permet de connaître l'intensité et la direction de la relation entre elles.

  • Article associé: "Alpha de Cronbach (α): qu'est-ce que c'est et comment est-il utilisé dans les statistiques"

statistiques descriptives

Le coefficient de corrélation de Pearson est un type de coefficient utilisé dans les statistiques descriptives. Spécifiquement, il est utilisé en statistique descriptive appliquée à l'étude de deux variables.

De son côté, la statistique descriptive (aussi appelée analyse exploratoire des données) regroupe un ensemble de techniques Mathématiques conçues pour obtenir, organiser, présenter et décrire un ensemble de données, dans le but de faciliter leur utiliser. En général, utilisez des tableaux, des mesures numériques ou des graphiques comme support.

instagram story viewer

Coefficient de corrélation de Pearson: à quoi ça sert ?

Le coefficient de corrélation de Pearson permet d'étudier la relation (ou corrélation) entre deux variables aléatoires quantitatives (échelle d'intervalle minimum); par exemple, la relation entre le poids et la taille.

C'est une mesure qui nous donne des informations sur l'intensité et la direction de la relation. En d'autres termes, il s'agit d'un indice qui mesure le degré de covariation entre différentes variables linéairement liées.

Il faut être clair sur la différence entre relation, corrélation ou covariation entre deux variables (= variable conjointe) et la causalité (également appelée prévision, prédiction ou régression), car ce sont des concepts différents.

  • Vous etes peut etre intéressé: "Test du chi carré (χ²): qu'est-ce que c'est et comment est-il utilisé dans les statistiques ?"

Comment est-il interprété ?

Coefficient de corrélation de Pearson comprend des valeurs comprises entre -1 et +1. Ainsi, selon sa valeur, il aura un sens ou un autre.

Si le coefficient de corrélation de Pearson est égal à 1 ou -1, on peut considérer que la corrélation qui existe entre les variables étudiées est parfaite.

Si le coefficient est supérieur à 0, la corrélation est positive (« A plus, plus et a moins moins). En revanche, s'il est inférieur à 0 (négatif), la corrélation est négative (« A plus, moins, et a moins, plus). Enfin, si le coefficient est égal à 0, on ne peut qu'affirmer qu'il n'y a pas de relation linéaire entre les variables, mais il peut y avoir un autre type de relation.

Considérations

Le coefficient de corrélation de Pearson augmente si la variabilité de X et/ou Y (les variables) augmente, et diminue dans le cas contraire. D'autre part, pour affirmer si une valeur est haute ou basse, nous devons comparer nos données avec d'autres enquêtes avec les mêmes variables et dans des circonstances similaires.

Pour représenter les relations de différentes variables qui se combinent linéairement, on peut utiliser la matrice dite de variance-covariance ou la matrice de corrélation; dans la diagonale du premier on trouvera des valeurs de variance, et dans le second on en trouvera des (la corrélation d'une variable avec elle-même est parfaite, =1).

coefficient au carré

Lorsque nous mettons au carré le coefficient de corrélation de Pearson, sa signification change, et nous interprétons sa valeur par rapport aux prévisions (indique la causalité de la relation). Autrement dit, dans ce cas, il peut avoir quatre interprétations ou significations :

1. Écart associé

Indique la proportion de la variance de Y (une variable) associée à la variation de X (l'autre variable). Par conséquent, nous saurons que "coefficient de Pearson au carré" = "proportion de la variance de Y qui n'est pas associée à la variation de X".

2. différences individuelles

Si nous multiplions le coefficient de corrélation de Pearson x100, cela indiquera le % des différences individuelles en Y qui sont associées / dépendent de / s'expliquent par des variations individuelles ou des différences de X. Par conséquent, "coefficient de Pearson au carré x 100" = % de différences individuelles dans Y qui n'est pas associé à / dépend de / s'explique par des variations ou des différences individuelles dans X.

3. Taux de réduction des erreurs

Le carré du coefficient de corrélation de Pearson il peut également être interprété comme un indice de la réduction de l'erreur dans les prévisions; c'est-à-dire qu'il s'agirait de la proportion de l'erreur quadratique moyenne éliminée à l'aide de Y' (la ligne de régression, construite à partir des résultats) au lieu de la moyenne de Y comme prévision. Dans ce cas, le coefficient x 100 serait également multiplié (indique le %).

Par conséquent, "coefficient de Pearson au carré" = erreur qui est toujours commise lors de l'utilisation de la droite de régression au lieu de la moyenne (toujours multiplié x 100 = indique le %).

4. Indice d'approximation des points

Enfin, la dernière interprétation du coefficient de corrélation de Pearson élevé au carré indiquerait l'approximation des points à la droite de régression commentée. Plus la valeur du coefficient est élevée (proche de 1), plus les points seront proches de Y' (de la droite).

Références bibliographiques:

  • Bouteille, J. Suero, m. Ximénez, C. (2012). Analyse des données en psychologie I. Madrid: Pyramide.
  • Lubin, P. Macia, A. Rubio de Lerma, P. (2005). Psychologie mathématique I et II. Madrid: UNED.
  • Pardo, a. Saint-Martin, R. (2006). Analyse des données en psychologie II. Madrid: Pyramide.
8 pays où partir pour recommencer une nouvelle vie

8 pays où partir pour recommencer une nouvelle vie

Dans de nombreux cas de mauvaises expériences passées ou le simple désir de se déconnecter nous ...

Lire la suite

Alpha de Cronbach (α): qu'est-ce que c'est et comment est-il utilisé en statistique

La psychométrie est la discipline qui est chargée de mesurer et de quantifier les variables psych...

Lire la suite

Comment calculer les centiles? Formule et procédure expliquées

Aujourd'hui, il est courant que nous ayons à travailler avec de grandes quantités de données, que...

Lire la suite