Стандартно отклонение: какво е това и за какво е тази мярка?
Терминът стандартно отклонение или стандартно отклонение се отнася до мярка, която се използва за количествено определяне на вариацията или дисперсията на цифровите данни. в случайна променлива, статистическа популация, набор от данни или вероятностно разпределение.
Светът на изследванията и статистиката може да изглежда сложен и чужд за общото население, както изглежда че математическите изчисления се случват пред очите ни, без да можем да разберем основните механизми на себе си. Нищо не е по-далеч от реалността.
По този повод ще разкажем по прост, но изчерпателен начин контекста, основаване и прилагане на толкова важен термин като стандартното отклонение в областта на статистика.
- Свързана статия: „Психология и статистика: Значението на вероятностите в науката за поведението“
Какво е стандартното отклонение?
Статистиката е клон на математиката, който отговаря за записването на променливостта, както и за произволния процес, който я генерира. следвайки законите на вероятността. Това се казва скоро, но в рамките на статистическите процеси са отговорите на всичко, което днес считаме за „догми“ в света на природата и физиката.
Например, да кажем, че при хвърляне на монета три пъти, две от тях излизат глави и опашки. Просто съвпадение, нали? От друга страна, ако хвърлим една и съща монета 700 пъти и 660 от тях паднат върху глави, може би е възможно да има фактор, който благоприятства това явление отвъд произволност (нека си представим например, че има време да направи само ограничен брой завъртания във въздуха, което означава, че почти винаги пада в едно и също режим). По този начин, наблюдаването на модели отвъд обикновеното съвпадение ни подтиква да мислим за основните причини за тенденцията.
Това, което искаме да демонстрираме с този странен пример е, че Статистиката е важен инструмент за всеки научен процес., защото въз основа на него можем да разграничим реалностите, които са резултат от случайността, от събитията, управлявани от природните закони.
По този начин можем да хвърлим прибързано определение на стандартното отклонение и да кажем, че това е статистическа мярка, която е продукт на корен квадратен от неговата дисперсия. Това е като да започнете къщата от покрива, защото за човек, който не е изцяло посветен на света на числата, това определение и непознаването на термина са малко по-различни. Така че нека отделим малко време, за да анализираме света на основните статистически модели..
Мерки за позиция и променливост
Измерванията на позицията са индикатори, използвани за посочване на това какъв процент от данните в рамките на честотно разпределение надхвърлят тези изрази, чиято стойност представлява стойността на данните, които са в центъра на честотното разпределение. Не се отчайвайте, защото ние ги дефинираме бързо:
- Средно: Средночислената стойност на извадката.
- Медиана: представлява стойността на променливата на централната позиция в набор от подредени данни.
По елементарен начин бихме могли да кажем, че измерванията на позицията са фокусирани върху разделянето на набора от данни на равни процентни части, тоест „стигане до средата“.
От друга страна, мерките за променливост са отговорни за определяне на степента на близост или разстояние на стойностите на разпределение в сравнение със средното му местоположение (т.е. спрямо средната стойност). Това са следните:
- Диапазон: Измерва ширината на данните, т.е. от минималната до максималната стойност.
- Дисперсия: очакването (средната стойност на серията данни) на квадрата на отклонението на споменатата променлива по отношение на нейната средна стойност.
- Стандартно отклонение: цифров индекс на дисперсията на набора от данни.
Разбира се, ние се движим в относително сложни условия за някой, който не е напълно посветен на света на математиката. Не искаме да навлизаме в други мерки за променливост, тъй като знаем, че колкото по-големи са числените продукти на тези параметри, толкова по-малко хомогенизиран ще бъде наборът от данни.
- Може да се интересувате от: "Психометрията: какво е това и за какво отговаря?"
„Средно на нетипичното“
След като циментирахме знанията за мерките за променливост и тяхното значение при анализа на данни, е време да пренасочим вниманието си към стандартното отклонение.
Без да навлизаме в сложни концепции (и може би да грешим да опростяваме нещата), можем да кажем, че тази мярка е продукт на изчисляване на средната стойност на „извънредните“ стойности. Нека дадем пример, за да изясним това определение:
Имаме извадка от шест бременни кучки от една и съща порода и възраст, които току-що са родили своите котила от кученца едновременно. Три от тях са родили по 2 кученца, а други три са родили по 4 кученца на женска. Естествено, средната стойност на потомството е 3 малки на женска (сумата от всички малки, разделена на общия брой женски).
Какво би било стандартното отклонение в този пример? Първо, трябва да извадим средната стойност от получените стойности и да повдигнем тази цифра на квадрат (тъй като не искаме отрицателни числа), например: 4-3=1 или 2-3= (-1, повдигнати на квадрат, 1) .
Дисперсията ще бъде изчислена като средна стойност на отклоненията от средната стойност (в този случай 3). Тук ще се сблъскаме с дисперсията и следователно трябва да вземем квадратен корен от тази стойност, за да я преобразуваме в същата числена скала като средната. След това ще получим стандартното отклонение.
Какво би било стандартното отклонение на нашия пример? Ами кученце. Смята се, че средната стойност за котилата е три малки, но е нормално майката да ражда едно по-малко или едно малко повече на котило.
Може би този пример може да звучи малко объркващо, що се отнася до дисперсията и отклонението (тъй като квадратният корен от 1 е 1), но ако дисперсията беше 4, резултатът от стандартното отклонение щеше да бъде 2 (не забравяйте, че неговият корен квадрат).
Това, което искахме да демонстрираме с този пример е, че дисперсията и стандартното отклонение са статистически мерки, които се стремят да получат средната стойност на стойности, различни от средната. Запомнете: колкото по-голямо е стандартното отклонение, толкова по-голяма е дисперсията на популацията.
Връщайки се към предишния пример, ако всички кучки са от една и съща порода и имат сходни килограми, нормално е отклонението да е едно кученце на котило. Но например, ако вземем мишка и слон, ясно е, че отклонението по отношение на броя на потомството ще достигне стойности, много по-големи от единица. Отново, колкото по-малко общо имат двете извадкови групи, толкова по-големи отклонения могат да се очакват.
Въпреки това, едно нещо е ясно: използвайки този параметър, ние изчисляваме дисперсията в данните от извадка, но това не трябва да е представително за цяла популация. В този пример сме хванали шест кучки, но какво ще стане, ако сме наблюдавали седем и седмата е имала котило от 9 кученца?
Разбира се, моделът на отклонение ще се промени. Поради тази причина вземете под внимание размерът на извадката е от съществено значение при интерпретирането на всеки набор от данни. Колкото повече индивидуални числа се събират и колкото пъти се повтаря един експеримент, толкова по-близо се доближаваме до постулирането на обща истина.
заключения
Както успяхме да наблюдаваме, стандартното отклонение е мярка за разсейване на данните. Колкото по-голяма е дисперсията, толкова по-голяма ще бъде тази стойност., защото ако бяхме изправени пред набор от напълно хомогенни резултати (т.е. всички те бяха равни на средната), този параметър щеше да бъде равен на 0.
Тази стойност е от огромно значение в статистиката, тъй като не всичко се свежда до намиране на общи мостове между цифри и събития, а по-скоро също така е от съществено значение да записваме променливостта между извадковите групи, за да си зададем повече въпроси и да получим повече знания в дългосрочен план. срок.
Библиографски справки:
- Изчислете стандартното отклонение стъпка по стъпка, khanacademy.org. Събрано на 29 август в https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- Хайме, С. и Винисио, М. (1973). Вероятност и статистика.
- Пара, Дж. м. (1995). Описателна и инференциална статистика I. Възстановено от: http://www. академия. edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.
- Рендон-Масиас, М. Е., Виласис-Кийв, М. А. и Миранда-Новалес, М. ж. (2016). Описателна статистика. Списание за алергии Мексико, 63 (4), 397-407.
- Рикардо, Ф. Q. (2011). Статистика, приложена към здравни изследвания. Получено от теста Хи-квадрат: http://www. medwave. cl/връзка. cgi/Medwave/серия/MBE04/5266.