Écart-type: qu'est-ce que c'est et à quoi sert cette mesure ?
Le terme écart type ou écart type fait référence à une mesure utilisée pour quantifier la variation ou la dispersion des données numériques. dans une variable aléatoire, une population statistique, un ensemble de données ou une distribution de probabilité.
Le monde de la recherche et des statistiques peut sembler complexe et étranger au grand public, tant il semble que des calculs mathématiques se passent sous nos yeux sans que nous puissions comprendre les mécanismes sous-jacents de la eux-mêmes. Rien n'est plus éloigné de la réalité.
A cette occasion nous allons relater de manière simple mais exhaustive le contexte, les fondement et application d'un terme aussi essentiel que l'écart-type dans le domaine de statistiques.
- Article associé: « Psychologie et statistiques: l'importance des probabilités dans la science du comportement »
Quel est l'écart type ?
La statistique est une branche des mathématiques chargée d'enregistrer la variabilité, ainsi que le processus aléatoire qui la génère. suivant les lois de la probabilité
. C'est dit bientôt, mais dans les processus statistiques se trouvent les réponses à tout ce que nous considérons aujourd'hui comme des "dogmes" dans le monde de la nature et de la physique.Par exemple, disons que lorsque vous lancez une pièce trois fois, deux d'entre eux sortent pile et face. Simple coïncidence, non? D'autre part, si nous lançons la même pièce 700 fois et que 660 d'entre elles tombent sur face, il est peut-être possible qu'il y ait un facteur qui favorise ce phénomène au-delà aléatoire (imaginons, par exemple, qu'il n'ait le temps de faire qu'un nombre limité de tours en l'air, ce qui signifie qu'il tombe presque toujours dans le même mode). Ainsi, observer des modèles au-delà de la simple coïncidence nous incite à réfléchir aux raisons sous-jacentes de la tendance.
Ce que nous voulons démontrer avec cet exemple bizarre, c'est que La statistique est un outil essentiel pour toute démarche scientifique., parce qu'à partir de là, nous pouvons distinguer les réalités qui sont le fruit du hasard des événements régis par les lois naturelles.
Ainsi, nous pouvons jeter une définition hâtive de l'écart type et dire que c'est une mesure statistique qui est le produit de la racine carrée de sa variance. C'est comme commencer la maison par le toit, car pour une personne qui ne se consacre pas entièrement au monde des chiffres, cette définition et ne rien savoir du terme sont peu différentes. Prenons donc un moment pour disséquer le monde des schémas statistiques de base..
Mesures de position et de variabilité
Les mesures de position sont des indicateurs utilisés pour indiquer quel pourcentage de données dans une distribution de fréquences dépasse ces expressions, dont la valeur représente la valeur des données qui se trouve au centre de la distribution de fréquence. Ne désespérez pas, car nous les définissons rapidement :
- Moyenne: La moyenne numérique de l'échantillon.
- Médiane: représente la valeur de la variable de position centrale dans un ensemble de données ordonnées.
De manière rudimentaire, nous pourrions dire que les mesures de position se concentrent sur la division de l'ensemble de données en parties égales en pourcentage, c'est-à-dire « arriver au milieu ».
D'autre part, les mesures de variabilité sont responsables de déterminer le degré de proximité ou d'éloignement des valeurs d'une distribution par rapport à sa localisation moyenne (c'est-à-dire par rapport à la moyenne). Ce sont les suivants :
- Plage: mesure la largeur des données, c'est-à-dire de la valeur minimale à la valeur maximale.
- Variance: l'espérance (moyenne de la série de données) du carré de l'écart de ladite variable par rapport à sa moyenne.
- Écart-type: indice numérique de la dispersion du jeu de données.
Bien sûr, nous avançons dans des termes relativement complexes pour quelqu'un qui n'est pas entièrement dédié au monde des mathématiques. Nous ne voulons pas entrer dans d'autres mesures de variabilité, sachant que plus les produits numériques de ces paramètres sont grands, moins le jeu de données sera homogénéisé.
- Vous etes peut etre intéressé: "La psychométrie: qu'est-ce que c'est et de quoi est-elle responsable ?"
"Méchant de l'Atypique"
Une fois que nous avons cimenté la connaissance des mesures de variabilité et leur importance dans l'analyse des données, il est temps de recentrer notre attention sur l'écart-type.
Sans entrer dans des concepts complexes (et peut-être commettre le péché de simplifier à l'excès), on peut dire que cette mesure est le produit du calcul de la moyenne des valeurs « aberrantes ». Donnons un exemple pour clarifier cette définition :
Nous avons un échantillon de six chiennes gestantes de la même race et du même âge qui viennent de donner naissance simultanément à leurs portées de chiots. Trois d'entre elles ont donné naissance à 2 chiots chacune, tandis que trois autres ont donné naissance à 4 chiots par femelle. Naturellement, la valeur moyenne de la progéniture est de 3 petits par femelle (la somme de tous les petits divisée par le nombre total de femelles).
Quel serait l'écart type dans cet exemple? Tout d'abord, il faudrait soustraire la moyenne des valeurs obtenues et élever ce chiffre au carré (puisque nous ne voulons pas de nombres négatifs), par exemple: 4-3=1 ou 2-3= (-1, élevé au carré, 1) .
La variance serait calculée comme la moyenne des écarts par rapport à la valeur moyenne (dans ce cas, 3). Ici, nous serions face à la variance, et par conséquent, nous devons prendre la racine carrée de cette valeur pour la transformer dans la même échelle numérique que la moyenne. Après cela, nous obtiendrions l'écart type.
Alors, quel serait l'écart type de notre exemple? Eh bien, un chiot. On estime que la moyenne des portées est de trois petits, mais il est normal que la mère donne naissance à un petit de moins ou un de plus par portée.
Peut-être que cet exemple peut sembler un peu déroutant en ce qui concerne la variance et l'écart (puisque la racine carrée de 1 est 1), mais si la variance était de 4, le résultat de l'écart type serait de 2 (rappelez-vous, sa racine carré).
Ce que nous voulions démontrer avec cet exemple, c'est que la variance et l'écart type sont des mesures statistiques qui cherchent à obtenir la moyenne de valeurs autres que la moyenne. Rappel: plus l'écart type est grand, plus la dispersion de la population est grande.
En reprenant l'exemple précédent, si toutes les chiennes sont de la même race et ont des poids similaires, il est normal que l'écart soit d'un chiot par portée. Mais par exemple, si nous prenons une souris et un éléphant, il est clair que l'écart en termes de nombre de descendants atteindrait des valeurs bien supérieures à un. Encore une fois, moins les deux groupes d'échantillons ont de points communs, plus on peut s'attendre à des écarts importants.
Même ainsi, une chose est claire: en utilisant ce paramètre, nous calculons la variance des données d'un échantillon, mais cela ne doit pas nécessairement être représentatif de toute une population. Dans cet exemple, nous avons attrapé six chiennes, mais que se passerait-il si nous en surveillions sept et que la septième avait une portée de 9 chiots ?
Bien sûr, le modèle de déviation changerait. Pour cette raison, tenez compte la taille de l'échantillon est essentielle lors de l'interprétation de tout ensemble de données. Plus on recueille de nombres individuels et plus une expérience est répétée, plus on se rapproche de postuler une vérité générale.
conclusion
Comme nous avons pu le constater, l'écart-type est une mesure de la dispersion des données. Plus la dispersion est grande, plus cette valeur sera grande., car si nous étions face à un ensemble de résultats complètement homogènes (c'est-à-dire qu'ils étaient tous égaux à la moyenne), ce paramètre serait égal à 0.
Cette valeur est d'une importance énorme en statistique, car tout ne se résume pas à trouver des ponts communs entre les chiffres et les événements, mais plutôt il est également essentiel d'enregistrer la variabilité entre les groupes d'échantillons afin de se poser davantage de questions et d'acquérir plus de connaissances à long terme. terme.
Références bibliographiques:
- Calculez l'écart type étape par étape, khanacademy.org. Récolté le 29 août à https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- Jaime, S., & Vinicio, M. (1973). Probabilité et statistique.
- Parra, J. M. (1995). Statistiques descriptives et inférentielles I. Rétabli: http://www. académie. edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.
- Rendón-Macías, M. E., Villasis-Keeve, M. Á., & Miranda-Novales, M. g. (2016). Statistiques descriptives. Allergy Magazine Mexique, 63(4), 397-407.
- Ricardo, F. Q (2011). Statistiques appliquées à la recherche en santé. Obtenu à partir du test Chi-Square: http://www. ondes médicales. cl/lien. cgi/Medwave/Series/MBE04/5266.