Coeficiente de correlação de Pearson: o que é e como usar
Ao pesquisar em psicologia, a estatística descritiva é frequentemente usada, o que oferece maneiras de apresentar e avaliar as principais características dos dados por meio de tabelas, gráficos e medidas resumos.
Neste artigo conheceremos o coeficiente de correlação de Pearson, uma medida de estatísticas descritivas. É uma medida linear entre duas variáveis aleatórias quantitativas, que nos permite conhecer a intensidade e a direção da relação entre elas.
- Artigo relacionado: "Alfa de Cronbach (α): o que é e como é usado na estatística"
estatísticas descritivas
O coeficiente de correlação de Pearson é um tipo de coeficiente usado em estatísticas descritivas. Especificamente, é usado em estatística descritiva aplicada ao estudo de duas variáveis.
Por sua vez, a estatística descritiva (também chamada de análise exploratória de dados) reúne um conjunto de técnicas Matemática destinada a obter, organizar, apresentar e descrever um conjunto de dados, com o objetivo de facilitar sua usar. Em geral, use tabelas, medidas numéricas ou gráficos como suporte.
Coeficiente de correlação de Pearson: para que serve?
O coeficiente de correlação de Pearson é usado para estudar a relação (ou correlação) entre duas variáveis aleatórias quantitativas (escala de intervalo mínimo); por exemplo, a relação entre peso e altura.
é uma medida que nos dá informações sobre a intensidade e direção do relacionamento. Em outras palavras, é um índice que mede o grau de covariação entre diferentes variáveis linearmente relacionadas.
Devemos ser claros sobre a diferença entre relação, correlação ou covariação entre duas variáveis (= variável conjunta) e causalidade (também chamada de previsão, previsão ou regressão), pois são conceitos diferentes.
- Você pode estar interessado: "Teste qui-quadrado (χ²): o que é e como é usado em estatística"
Como é interpretado?
coeficiente de correlação de Pearson inclui valores entre -1 e +1. Assim, dependendo do seu valor, terá um significado ou outro.
Se o coeficiente de correlação de Pearson for igual a 1 ou -1, podemos considerar que a correlação existente entre as variáveis estudadas é perfeita.
Se o coeficiente for maior que 0, a correlação é positiva (“A mais, mais e menos menos). Por outro lado, se for menor que 0 (negativo), a correlação é negativa (“A mais, menos e menos, mais). Por fim, se o coeficiente for igual a 0, podemos apenas afirmar que não há relação linear entre as variáveis, mas pode haver algum outro tipo de relação.
Considerações
O coeficiente de correlação de Pearson aumenta se a variabilidade de X e/ou Y (as variáveis) aumenta, e diminui caso contrário. Por outro lado, para afirmar se um valor é alto ou baixo, devemos comparar nossos dados com outras investigações com as mesmas variáveis e em circunstâncias semelhantes.
Para representar as relações de diferentes variáveis que se combinam linearmente, podemos usar a chamada matriz de variância-covariância ou matriz de correlação; na diagonal da primeira encontraremos valores de variância, e na segunda encontraremos valores (a correlação de uma variável consigo mesma é perfeita, =1).
coeficiente quadrado
Quando elevamos ao quadrado o coeficiente de correlação de Pearson, seu significado muda, e interpretamos seu valor em relação às previsões (indica causalidade da relação). Ou seja, neste caso, pode ter quatro interpretações ou significados:
1. Variação associada
Indica a proporção da variância de Y (uma variável) associada à variação de X (a outra variável). Portanto, saberemos que "coeficiente de Pearson de 1 quadrado" = "proporção da variância de Y que não está associada à variação de X".
2. diferenças individuais
Se multiplicarmos o coeficiente de correlação de Pearson x100, ele indicará a % das diferenças individuais em Y que estão associadas / dependem de / são explicados por variações individuais ou diferenças em X. Portanto, "coeficiente de Pearson de 1 quadrado x 100" = % de diferenças individuais em Y que não está associada a / depende de / é explicada por variações individuais ou diferenças em X.
3. Taxa de redução de erros
O coeficiente de correlação de Pearson ao quadrado também pode ser interpretado como um índice da redução do erro nas previsões; ou seja, seria a proporção da raiz do erro quadrático médio eliminada usando Y' (a linha de regressão, construída a partir dos resultados) em vez da média de Y como previsão. Neste caso, o coeficiente x 100 também seria multiplicado (indica o %).
Portanto, "coeficiente de Pearson de 1 quadrado" = erro que ainda é cometido ao usar a linha de regressão em vez da média (sempre multiplicado x 100 = indica o %).
4. Índice de aproximação de pontos
Por fim, a última interpretação do coeficiente de correlação de Pearson elevado ao quadrado indicaria a aproximação dos pontos à linha de regressão comentada. Quanto maior o valor do coeficiente (mais próximo de 1), mais próximos os pontos estarão de Y' (da reta).
Referências bibliográficas:
- Garrafa, J. Suero, m. Ximenez, C. (2012). Análise de dados em psicologia I. Madri: Pirâmide.
- Lubin, P. Macia, A. Rubio de Lerma, P. (2005). Psicologia matemática I e II. Madri: UNED.
- Pardo, a. São Martinho, R. (2006). Análise de dados em psicologia II. Madri: Pirâmide.