Desvio padrão: o que é e para que serve essa medida?
O termo desvio padrão ou desvio padrão refere-se a uma medida usada para quantificar a variação ou dispersão de dados numéricos. em uma variável aleatória, população estatística, conjunto de dados ou distribuição de probabilidade.
O mundo da pesquisa e da estatística pode parecer complexo e estranho para a população em geral, como parece que os cálculos matemáticos acontecem sob nossos olhos sem que possamos entender os mecanismos subjacentes do eles mesmos. Nada está mais longe da realidade.
Nesta ocasião vamos relatar de forma simples mas exaustiva o contexto, a fundamento e aplicação de um termo tão essencial quanto o desvio padrão no campo da Estatisticas.
- Artigo relacionado: "Psicologia e Estatística: A Importância das Probabilidades na Ciência do Comportamento"
Qual é o desvio padrão?
A estatística é um ramo da matemática responsável por registrar a variabilidade, bem como o processo aleatório que a gera. seguindo as leis da probabilidade. Isso é dito logo, mas dentro dos processos estatísticos estão as respostas para tudo o que hoje consideramos como "dogmas" no mundo da natureza e da física.
Por exemplo, digamos que ao jogar uma moeda três vezes, duas delas resultam em cara e coroa. Simples coincidência, certo? Por outro lado, se jogarmos a mesma moeda 700 vezes e 660 delas derem cara, talvez seja possível que haja um fator que favorece esse fenômeno além aleatoriedade (imaginemos, por exemplo, que só tem tempo para fazer um número limitado de voltas no ar, o que significa que cai quase sempre no mesmo modo). Assim, observar padrões além da mera coincidência nos leva a pensar sobre as razões subjacentes à tendência.
O que queremos demonstrar com este exemplo bizarro é que A estatística é uma ferramenta essencial para qualquer processo científico., porque a partir dela podemos distinguir realidades resultantes do acaso de eventos regidos por leis naturais.
Assim, podemos lançar uma definição precipitada do desvio padrão e dizer que é uma medida estatística que é o produto da raiz quadrada de sua variância. Isso é como começar a casa pelo telhado, porque para uma pessoa que não se dedica totalmente ao mundo dos números, essa definição e não saber nada sobre o termo são um pouco diferentes. Então, vamos separar um momento para dissecar o mundo dos padrões estatísticos básicos..
Medidas de posição e variabilidade
As medidas de posição são indicadores usados para indicar qual porcentagem de dados dentro de uma distribuição de frequência excede essas expressões, cujo valor representa o valor dos dados que estão no centro da distribuição de frequência. Não se desespere, porque nós os definimos rapidamente:
- Média: a média numérica da amostra.
- Mediana: representa o valor da variável de posição central em um conjunto de dados ordenados.
De forma rudimentar, poderíamos dizer que as medidas de posição são focadas em dividir o conjunto de dados em partes percentuais iguais, ou seja, “chegar ao meio”.
Por outro lado, as medidas de variabilidade são responsáveis por determinar o grau de proximidade ou distância dos valores de uma distribuição em comparação com sua localização média (ou seja, versus a média). Estes são os seguintes:
- Faixa: Mede a largura dos dados, ou seja, do valor mínimo ao valor máximo.
- Variância: a expectativa (média da série de dados) do quadrado do desvio da referida variável em relação à sua média.
- Desvio padrão: índice numérico da dispersão do conjunto de dados.
Claro que estamos nos movendo em termos relativamente complexos para quem não se dedica totalmente ao mundo da matemática. Não queremos entrar em outras medidas de variabilidade, pois sabendo que quanto maiores os produtos numéricos desses parâmetros, menos homogeneizado será o conjunto de dados.
- Você pode estar interessado: "Psicometria: o que é e pelo que é responsável?"
“Média do Atípico”
Uma vez consolidado o conhecimento das medidas de variabilidade e sua importância na análise de dados, é hora de reorientar nossa atenção para o desvio padrão.
Sem entrar em conceitos complexos (e talvez cometendo o pecado de simplificar demais as coisas), podemos dizer que esta medida é o produto do cálculo da média dos valores “outlier”. Vamos dar um exemplo para esclarecer essa definição:
Temos uma amostra de seis cadelas gestantes da mesma raça e idade que acabaram de parir suas ninhadas de filhotes simultaneamente. Três delas deram à luz 2 filhotes cada, enquanto outras três deram à luz 4 filhotes por fêmea. Naturalmente, o valor médio da prole é de 3 filhotes por fêmea (a soma de todos os filhotes dividida pelo número total de fêmeas).
Qual seria o desvio padrão neste exemplo? Antes de tudo, teríamos que subtrair a média dos valores obtidos e elevar esse valor ao quadrado (já que não queremos números negativos), por exemplo: 4-3=1 ou 2-3= (-1, elevado ao quadrado, 1) .
A variância seria calculada como a média dos desvios do valor médio (neste caso, 3). Aqui estaríamos diante da variância e, portanto, temos que tirar a raiz quadrada desse valor para transformá-lo na mesma escala numérica da média. Depois disso obteríamos o desvio padrão.
Então, qual seria o desvio padrão do nosso exemplo? Bem, um cachorrinho. Estima-se que a média por ninhadas seja de três filhotes, mas é normal que a mãe dê à luz um filhote a menos ou um a mais por ninhada.
Talvez este exemplo possa parecer um pouco confuso no que diz respeito à variância e ao desvio (já que a raiz quadrada de 1 é 1), mas se a variância fosse 4, o resultado do desvio padrão seria 2 (lembre-se, sua raiz quadrado).
O que queríamos demonstrar com este exemplo é que variância e desvio padrão são medidas estatísticas que buscam obter a média de valores diferentes da média. Lembre-se: quanto maior o desvio padrão, maior a dispersão da população.
Voltando ao exemplo anterior, se todas as cadelas forem da mesma raça e tiverem pesos semelhantes, é normal que o desvio seja de um filhote por ninhada. Mas, por exemplo, se pegarmos um rato e um elefante, é claro que o desvio em termos de número de descendentes atingiria valores muito superiores a um. Novamente, quanto menos os dois grupos de amostras tiverem em comum, maiores os desvios que podem ser esperados.
Mesmo assim, uma coisa é certa: com esse parâmetro estamos calculando a variância dos dados de uma amostra, mas isso não precisa ser representativo de toda uma população. Neste exemplo pegamos seis cadelas, mas e se monitorássemos sete e a sétima tivesse uma ninhada de 9 filhotes?
Claro, o padrão de desvio mudaria. Por este motivo, leve em consideração tamanho da amostra é essencial ao interpretar qualquer conjunto de dados. Quanto mais números individuais são coletados e mais vezes um experimento é repetido, mais perto chegamos de postular uma verdade geral.
conclusões
Como pudemos observar, o desvio padrão é uma medida de dispersão de dados. Quanto maior a dispersão, maior será esse valor., pois se estivéssemos diante de um conjunto de resultados completamente homogêneos (ou seja, que fossem todos iguais à média), esse parâmetro seria igual a 0.
Este valor é de enorme importância em estatística, pois nem tudo se reduz a encontrar pontes comuns entre números e acontecimentos, mas sim também é essencial registrar a variabilidade entre os grupos amostrais para nos questionarmos mais e obtermos mais conhecimento a longo prazo. prazo.
Referências bibliográficas:
- Calcule o desvio padrão passo a passo, khanacademy.org. Coletado em 29 de agosto em https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- Jaime, S., & Vinício, M. (1973). Probabilidade e Estatística.
- Pará, J. m. (1995). Estatística descritiva e inferencial I. Recuperado de: http://www. Academia. edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.
- Rendón-Macías, M. E., Villasis-Keeve, M. Á., & Miranda-Novales, M. g. (2016). Estatística descritiva. Allergy Magazine México, 63(4), 397-407.
- Ricardo, f. Q. (2011). Estatística aplicada à pesquisa em saúde. Obtido a partir do teste qui-quadrado: http://www. medwave. cl/link. cgi/Medwave/Series/MBE04/5266.