Směrodatná odchylka: co to je a k čemu je toto opatření?
Pojem směrodatná odchylka nebo směrodatná odchylka se týká míry, která se používá ke kvantifikaci variace nebo rozptylu číselných dat. v náhodné proměnné, statistické populaci, souboru dat nebo rozdělení pravděpodobnosti.
Svět výzkumu a statistiky se může zdát běžné populaci složitý a cizí, jak se zdá že matematické výpočty se dějí pod našima očima, aniž bychom byli schopni porozumět základním mechanismům oni sami. Nic není vzdálenější realitě.
Při této příležitosti jednoduchým, ale vyčerpávajícím způsobem vylíčíme kontext, tzv založení a použití termínu stejně zásadního jako směrodatná odchylka v oboru statistika.
- Související článek: „Psychologie a statistika: Význam pravděpodobností ve vědě o chování“
Jaká je směrodatná odchylka?
Statistika je odvětví matematiky, které je zodpovědné za zaznamenávání variability a také náhodného procesu, který ji generuje. podle zákonů pravděpodobnosti. To se říká brzy, ale v rámci statistických procesů jsou odpovědi na vše, co dnes ve světě přírody a fyziky považujeme za „dogmata“.
Řekněme například, že když hodíte mincí třikrát, dva z nich vyletí hlavou a ocasem. Jednoduchá náhoda, že? Na druhou stranu, pokud hodíme stejnou mincí 700krát a 660 z nich dopadne na hlavu, možná je možné, že existuje faktor, který tento jev podporuje mimo náhodnost (představme si například, že má čas udělat ve vzduchu jen omezený počet otáček, což znamená, že téměř vždy padá do stejného režim). Pozorování vzorců za pouhou shodou okolností nás tedy vede k zamyšlení nad základními důvody tohoto trendu.
To, co chceme tímto bizarním příkladem demonstrovat, je to Statistika je nezbytným nástrojem pro jakýkoli vědecký proces., protože na jeho základě jsme schopni rozlišit skutečnosti, které jsou výsledkem náhody, od událostí, které se řídí přírodními zákony.
Můžeme tedy hodit unáhlenou definici směrodatné odchylky a říci, že jde o statistickou míru, která je součinem druhé odmocniny jejího rozptylu. Je to jako začínat dům od střechy, protože pro člověka, který se světu čísel úplně nevěnuje, je tato definice a neznalost tohoto pojmu trochu odlišná. Pojďme si tedy na chvíli rozebrat svět základních statistických vzorců..
Míry polohy a variability
Míry polohy jsou indikátory používané k označení toho, jaké procento dat v rámci distribuce frekvence překračuje tyto výrazy, jehož hodnota představuje hodnotu dat, která je ve středu frekvenčního rozdělení. Nezoufejte, protože je rychle definujeme:
- Průměr: Číselný průměr vzorku.
- Medián: představuje hodnotu centrální proměnné polohy v sadě uspořádaných dat.
Základním způsobem bychom mohli říci, že poziční míry jsou zaměřeny na rozdělení datového souboru na stejné procentuální části, tedy „dostat se do středu“.
Na druhé straně jsou za to zodpovědné míry variability určit stupeň blízkosti nebo vzdálenosti hodnot distribuce ve srovnání s jeho průměrnou polohou (tj. oproti průměru). Jedná se o následující:
- Rozsah: Měří šířku dat, to znamená od minimální po maximální hodnotu.
- Rozptyl: očekávání (střední hodnota datové řady) druhé mocniny odchylky uvedené proměnné vzhledem k jejímu průměru.
- Směrodatná odchylka: číselný index rozptylu souboru dat.
Samozřejmě se pohybujeme v poměrně složitých pojmech pro někoho, kdo se plně nevěnuje světu matematiky. Nechceme se pouštět do jiných měřítek variability, protože s vědomím, že čím větší jsou číselné součiny těchto parametrů, tím méně homogenizovaný bude soubor dat.
- Mohlo by vás zajímat: "Psychometrie: co to je a za co je zodpovědná?"
„Prostředek atypického“
Jakmile jsme si upevnili znalosti o mírách variability a jejich důležitosti v analýze dat, je čas znovu zaměřit naši pozornost na směrodatnou odchylku.
Aniž bychom zacházeli do složitých pojmů (a možná se dopustili hříchu přílišného zjednodušování věcí), můžeme to říci tato míra je výsledkem výpočtu průměru „odlehlých“ hodnot. Pro objasnění této definice uveďme příklad:
Máme vzorek šesti březích fen stejného plemene a věku, které právě porodily své vrhy štěňat současně. Tři z nich porodily po 2 štěňatech a další tři porodily 4 štěňata na fenku. Průměrná hodnota potomků je přirozeně 3 mláďata na samici (součet všech mláďat dělený celkovým počtem samic).
Jaká by byla standardní odchylka v tomto příkladu? Nejprve bychom museli od získaných hodnot odečíst průměr a tento údaj zvýšit na druhou mocninu (protože nechceme záporná čísla), například: 4-3=1 nebo 2-3= (-1, zvednutý do čtverce, 1) .
Rozptyl by se vypočítal jako průměr odchylek od střední hodnoty (v tomto případě 3). Zde bychom čelili rozptylu, a proto musíme vzít druhou odmocninu této hodnoty, abychom ji převedli na stejnou číselnou stupnici jako průměr. Poté bychom dostali směrodatnou odchylku.
Jaká by tedy byla směrodatná odchylka našeho příkladu? No, štěně. Odhaduje se, že průměr vrhů jsou tři potomci, ale je normální, že matka porodí o jedno mládě méně nebo o jedno více na vrh.
Možná by tento příklad mohl znít trochu zmateně, pokud jde o rozptyl a odchylku (protože druhá odmocnina z 1 je 1), ale pokud by rozptyl byl 4, výsledek směrodatné odchylky by byl 2 (pamatujte, její kořen náměstí).
To, co jsme tímto příkladem chtěli demonstrovat, je to rozptyl a směrodatná odchylka jsou statistická měření, která se snaží získat průměr hodnot jiných, než je průměr. Pamatujte: čím větší směrodatná odchylka, tím větší rozptyl populace.
Vrátíme-li se k předchozímu příkladu, pokud jsou všechny feny stejného plemene a mají podobnou hmotnost, je normální, že odchylka je jedno štěně na vrh. Ale například, když vezmeme myš a slona, je jasné, že odchylka v počtu potomků by dosáhla hodnot mnohem větších než jedna. Opět platí, že čím méně mají obě výběrové skupiny společného, tím větší odchylky lze očekávat.
I tak je ale jedna věc jasná: pomocí tohoto parametru počítáme rozptyl v datech vzorku, ale ten nemusí být reprezentativní pro celou populaci. V tomto příkladu jsme chytili šest fen, ale co kdybychom sledovali sedm a sedmá měla vrh 9 štěňat?
Vzorec odchylky by se samozřejmě změnil. Z tohoto důvodu berte v úvahu velikost vzorku je zásadní při interpretaci jakéhokoli souboru dat. Čím více jednotlivých čísel je shromážděno a čím vícekrát se experiment opakuje, tím blíže se dostáváme k postulování obecné pravdy.
závěry
Jak jsme mohli pozorovat, směrodatná odchylka je mírou rozptylu dat. Čím větší je rozptyl, tím větší bude tato hodnota., protože pokud bychom stáli před sadou zcela homogenních výsledků (to znamená, že by se všechny rovnaly průměru), tento parametr by se rovnal 0.
Tato hodnota má ve statistice obrovský význam, protože ne vše se redukuje na hledání společných mostů mezi postavami a událostmi, ale spíše je také nezbytné zaznamenávat variabilitu mezi vzorovými skupinami, abychom si mohli klást více otázek a získávat více znalostí v dlouhodobém horizontu. období.
Bibliografické odkazy:
- Vypočítejte směrodatnou odchylku krok za krokem, khanacademy.org. Sebráno 29. srpna in https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- Jaime, S., & Vinicio, M. (1973). Pravděpodobnost a statistika.
- Parra, J. m (1995). Deskriptivní a inferenční statistika I. Obnoveno z: http://www. akademie. edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.
- Rendón-Macías, M. E., Villasis-Keeve, M. Á., & Miranda-Novales, M. G. (2016). Deskriptivní statistika. Allergy Magazine Mexico, 63(4), 397-407.
- Ricardo, F. Q. (2011). Statistiky aplikované na výzkum zdraví. Získané z testu Chí-kvadrát: http://www. medwave. cl/odkaz. cgi/Medwave/Series/MBE04/5266.