Стандардна девијација: шта је то и чему служи ова мера?
Термин стандардна девијација или стандардна девијација се односи на меру која се користи за квантификацију варијације или дисперзије нумеричких података. у случајној променљивој, статистичкој популацији, скупу података или дистрибуцији вероватноће.
Свет истраживања и статистике може изгледати сложено и страно општој популацији, како се чини да се математички прорачуни дешавају под нашим очима, а да не можемо да разумемо основне механизме себе. Ништа није даље од стварности.
Овом приликом ћемо на једноставан, али исцрпан начин приказати контекст, тј утемељење и примена појма суштински као стандардна девијација у области статистика.
- Повезани чланак: „Психологија и статистика: значај вероватноће у науци о понашању“
Шта је стандардна девијација?
Статистика је грана математике која је одговорна за евидентирање варијабилности, као и за случајни процес који је генерише. пратећи законе вероватноће. То ће ускоро бити речено, али у оквиру статистичких процеса налазе се одговори на све оно што данас сматрамо „догмама“ у свету природе и физике.
На пример, рецимо да када се новчић баци три пута, два од њих испадну глава и реп. Проста случајност, зар не? С друге стране, ако бацимо исти новчић 700 пута и 660 их падне на главу, можда је могуће да постоји фактор који фаворизује овај феномен изван случајност (замислимо, на пример, да има времена да направи само ограничен број окрета у ваздуху, што значи да скоро увек пада у исто режим). Дакле, посматрање образаца изван пуке случајности подстиче нас да размислимо о основним разлозима за овај тренд.
Оно што желимо да покажемо овим бизарним примером је то Статистика је суштински алат за сваки научни процес., јер на основу њега умемо да разликујемо стварности које су резултат случајности од догађаја вођених природним законима.
Дакле, можемо бацити исхитрену дефиницију стандардне девијације и рећи да је то статистичка мера која је производ квадратног корена њене варијансе. Ово је као да започнете кућу са крова, јер за особу која није у потпуности посвећена свету бројева, ова дефиниција и непознавање појма су мало другачији. Зато хајде да одвојимо тренутак да сецирамо свет основних статистичких образаца..
Мере положаја и варијабилности
Мере положаја су индикатори који се користе да укажу који проценат података унутар дистрибуције фреквенције премашује ове изразе, чија вредност представља вредност податка који се налази у центру расподеле фреквенција. Не очајавајте, јер их брзо дефинишемо:
- Средња вредност: нумерички просек узорка.
- Медијан: представља вредност променљиве централне позиције у скупу уређених података.
На рудиментаран начин, могли бисмо рећи да су мере позиције усмерене на поделу скупа података на једнаке процентуалне делове, односно „долазак до средине“.
С друге стране, мере варијабилности су одговорне за одредити степен блискости или удаљености вредности дистрибуције у поређењу са њеном просечном локацијом (тј. у односу на средњу вредност). Ово су следеће:
- Опсег: Мери ширину података, односно од минималне до максималне вредности.
- Варијанца: очекивање (средња вредност серије података) квадрата девијације наведене варијабле у односу на њену средњу вредност.
- Стандардна девијација: нумерички индекс дисперзије скупа података.
Наравно, крећемо се у релативно сложеним терминима за некога ко није у потпуности посвећен свету математике. Не желимо да улазимо у друге мере варијабилности, јер знајући да што су бројчани производи ових параметара већи, скуп података ће бити мање хомогенизован.
- Можда ће вас занимати: "Психометрија: шта је то и за шта је одговорна?"
“Средство атипичног”
Када смо учврстили знање о мерама варијабилности и њиховом значају у анализи података, време је да поново усмеримо пажњу на стандардну девијацију.
Не улазећи у сложене концепте (и можда чинећи грех превеликог упрошћавања ствари), можемо рећи да ова мера је производ израчунавања средње вредности „изузетних“ вредности. Хајде да дамо пример да разјаснимо ову дефиницију:
Имамо узорак од шест гравидних куја исте расе и старости које су истовремено окотиле своја легла штенаца. Троје је окотило по 2 штенета, док је још троје окотило по 4 штенета по женки. Наравно, средња вредност потомака је 3 младунца по женки (збир свих младунаца подељен са укупним бројем женки).
Која би била стандардна девијација у овом примеру? Пре свега, морали бисмо да одузмемо средњу вредност од добијених вредности и подигнемо ову цифру на квадрат (пошто не желимо негативне бројеве), на пример: 4-3=1 или 2-3= (-1, подигнут на квадрат, 1) .
Варијанца би била израчуната као средња вредност одступања од средње вредности (у овом случају, 3). Овде бисмо се суочили са варијансом, и стога, морамо узети квадратни корен ове вредности да бисмо је трансформисали у исту нумеричку скалу као и средња вредност. Након овога добили бисмо стандардну девијацију.
Дакле, која би била стандардна девијација нашег примера? Па, штене. Процењује се да је просек за легла три потомства, али је нормално да мајка окоти једно штене мање или више по леглу.
Можда би овај пример могао звучати мало збуњујуће што се варијансе и девијације тиче (пошто је квадратни корен од 1 1), али да је варијанса 4, резултат стандардне девијације би био 2 (запамтите, њен корен квадрат).
Оно што смо хтели да покажемо овим примером је да варијанса и стандардна девијација су статистичке мере које настоје да добију средњу вредност других вредности од средње вредности. Запамтите: што је већа стандардна девијација, већа је дисперзија становништва.
Да се вратимо на претходни пример, ако су све кучке исте расе и сличне тежине, нормално је да одступање буде једно штене по леглу. Али, на пример, ако узмемо миша и слона, јасно је да би одступање у погледу броја потомака достигло вредности много веће од један. Опет, што мање две групе узорака имају заједничког, то се могу очекивати већа одступања.
Ипак, једна ствар је јасна: користећи овај параметар ми израчунавамо варијансу у подацима узорка, али то не мора бити репрезентативно за целу популацију. У овом примеру смо ухватили шест куја, али шта ако смо пратили седам, а седма је имала легло од 9 штенаца?
Наравно, образац одступања би се променио. Из тог разлога, узмите у обзир величина узорка је неопходна када се тумачи било који скуп података. Што се више појединачних бројева прикупи и што се експеримент више пута понавља, то смо ближе постулирању опште истине.
закључци
Као што смо могли да приметимо, стандардна девијација је мера дисперзије података. Што је већа дисперзија, већа ће бити ова вредност., јер ако бисмо били суочени са скупом потпуно хомогених резултата (то јест, да су сви једнаки средњој вредности), овај параметар би био једнак 0.
Ова вредност је од огромног значаја у статистици, јер се не своди све на проналажење заједничких мостова између фигура и догађаја, већ такође је неопходно забележити варијабилност између група узорака како бисмо себи поставили више питања и стекли више знања на дужи рок. термин.
Библиографске референце:
- Израчунајте стандардну девијацију корак по корак, кханацадеми.орг. Сакупљено 29. августа у https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- Јаиме, С. и Виницио, М. (1973). Вероватноћа и статистика.
- Парра, Ј. м. (1995). Дескриптивна и инференцијална статистика И. Опоравио од: http://www. академија. еду/довнлоад/35987432/ЕСТАДИСТИЦА_ДЕСЦРИПТИВА_Е_ИНФЕРЕНЦИАЛ. пдф.
- Рендон-Масијас, М. Е., Вилласис-Кееве, М. А., и Миранда-Новалес, М. г. (2016). Дескриптивна статистика. Аллерги Магазине Мекицо, 63(4), 397-407.
- Рикардо, Ф. П. (2011). Статистика примењена на здравствена истраживања. Добијено из Хи-квадрат теста: http://www. медваве. цл/линк. цги/Медваве/Сериес/МБЕ04/5266.