Szórás: mi ez és mire való ez a mérték?
A szórás vagy szórás kifejezés olyan mértékre utal, amelyet a számszerű adatok változásának vagy szórásának számszerűsítésére használnak. valószínűségi változóban, statisztikai sokaságban, adathalmazban vagy valószínűségi eloszlásban.
A kutatás és a statisztika világa bonyolultnak és idegennek tűnhet a lakosság számára, ahogyan az látszik hogy a matematikai számítások a szemünk alatt történnek anélkül, hogy megértenénk a mögöttes mechanizmusokat a maguk. Semmi sem áll távolabb a valóságtól.
Ebből az alkalomból egyszerű, de kimerítő módon ismertetjük a szövegkörnyezetet, a szakterületen olyan lényeges kifejezés megalapozása és alkalmazása, mint a szórás statisztika.
- Kapcsolódó cikk: "Pszichológia és statisztika: a valószínűségek jelentősége a viselkedéstudományban"
Mi a szórás?
A statisztika a matematikának egy olyan ága, amely a változékonyság rögzítéséért, valamint az azt generáló véletlenszerű folyamatért felelős. a valószínűség törvényeit követve. Ez hamarosan elhangzik, de a statisztikai folyamatokon belül ott vannak a válaszok mindarra, amit ma "dogmának" tekintünk a természet és a fizika világában.
Tegyük fel például, hogy ha háromszor feldobunk egy érmét, kettőnek feje és farka jön fel. Egyszerű véletlen, igaz? Másrészt, ha 700-szor feldobjuk ugyanazt az érmét, és ebből 660-an a fejükön landolnak, akkor lehetséges, hogy van olyan tényező, amely túlmutat ennek a jelenségnek. véletlenszerűség (képzeljük el például, hogy csak korlátozott számú fordulatot ér el a levegőben, ami azt jelenti, hogy szinte mindig ugyanabba esik mód). Így a puszta véletlenen túlmutató minták megfigyelése arra késztet bennünket, hogy elgondolkodjunk a trend mögött meghúzódó okokon.
Ezzel a bizarr példával azt szeretnénk demonstrálni A statisztika minden tudományos folyamat elengedhetetlen eszköze., mert ez alapján meg tudjuk különböztetni a véletlenből fakadó valóságokat a természeti törvények által szabályozott eseményektől.
Így elhamarkodottan meghatározhatjuk a szórást, és azt mondhatjuk, hogy ez egy statisztikai mérőszám, amely a szórása négyzetgyökének szorzata. Ez olyan, mintha a házat a tetőről kezdené, mert egy olyan ember számára, aki nem teljesen elkötelezett a számok világa iránt, ez a meghatározás és a fogalomról semmit sem tudó ember számára alig különbözik. Tehát szánjunk egy pillanatot az alapvető statisztikai minták világának boncolgatására..
A helyzet és a változékonyság mértéke
A pozíciómértékek olyan mutatók, amelyek jelzik, hogy egy gyakorisági eloszláson belül az adatok hány százaléka haladja meg ezeket a kifejezéseket, amelynek értéke a gyakorisági eloszlás középpontjában lévő adat értékét jelenti. Ne essen kétségbe, mert gyorsan meghatározzuk őket:
- Átlag: A minta numerikus átlaga.
- Medián: a központi pozícióváltozó értékét reprezentálja egy rendezett adathalmazban.
Kezdetlegesen azt mondhatnánk, hogy a pozíciómértékek az adathalmaz egyenlő százalékos részekre osztására, vagyis a „középre kerülésre” irányulnak.
Másrészt a változékonyság mértékei felelősek meghatározza egy eloszlás értékeinek közelségének vagy távolságának mértékét az átlagos helyhez képest (azaz az átlaggal szemben). Ezek a következők:
- Tartomány: Az adatok szélességét méri, azaz a minimumtól a maximális értékig.
- Variancia: az említett változó átlagától való eltérésének négyzetének elvárása (az adatsor átlaga).
- Szórás: az adatsor szórásának numerikus indexe.
Természetesen viszonylag összetett fogalmakkal foglalkozunk valakivel, aki nem teljesen elkötelezett a matematika világa iránt. A variabilitás egyéb mérőszámaiba nem kívánunk belemenni, hiszen tudva, hogy minél nagyobb ezeknek a paramétereknek a számszerű szorzata, annál kevésbé lesz homogenizált az adathalmaz.
- Érdekelheti: "Pszichometria: mi ez és miért felelős?"
„Az atipikusok közepe”
Miután bebetonoztuk a variabilitás mértékeinek és az adatelemzésben betöltött fontosságuk ismeretét, ideje, hogy figyelmünket a szórásra irányítsuk.
Anélkül, hogy bonyolult fogalmakba bocsátkoznánk (és talán elkövetnénk a dolgok túlzott leegyszerűsítésének bűnét), ezt mondhatjuk ez a mérték a „kiugró” értékek átlagának kiszámításának szorzata. Adjunk egy példát ennek a definíciónak a tisztázására:
Hat azonos fajtájú és korú vemhes szukából álló mintánk van, akik éppen egyidőben szülték meg almukat. Közülük hárman 2-2 kölyökkutyát hoztak világra, míg további három nőstényenként 4 kölyökkutyát szült. Természetesen az utódok átlagos értéke nőstényenként 3 kölyök (az összes kölyök összege osztva a nőstények teljes számával).
Mi lenne a szórása ebben a példában? Először is ki kell vonnunk az átlagot a kapott értékekből, és ezt a számot négyzetre kell emelnünk (mivel nem akarunk negatív számokat), például: 4-3=1 vagy 2-3= (-1), négyzetre emelve, 1) .
A variancia az átlagértéktől való eltérések átlagaként kerül kiszámításra (ebben az esetben 3). Itt a szórással állunk szemben, ezért ennek az értéknek a négyzetgyökét kell venni, hogy az átlaggal azonos numerikus skálára transzformáljuk. Ezt követően megkapjuk a szórást.
Tehát mi lenne a példánk szórása? Hát egy kiskutya. Becslések szerint az alom átlaga három utód, de normális, ha az anya almonként eggyel kevesebbet vagy eggyel több kölyköt hoz világra.
Talán ez a példa kissé zavaróan hangozhat a szórást és az eltérést illetően (mivel az 1 négyzetgyöke 1), de ha a variancia 4 lenne, akkor a szórás eredménye 2 lenne (ne feledjük, a gyöke négyzet).
Amit ezzel a példával demonstrálni akartunk, az az A variancia és a szórás olyan statisztikai mérőszámok, amelyek az átlagtól eltérő értékek átlagát próbálják megszerezni. Ne feledje: minél nagyobb a szórás, annál nagyobb a sokaság szórása.
Visszatérve az előző példához, ha az összes szuka azonos fajtájú és hasonló súlyú, akkor normális, hogy az eltérés almonként egy kölyök. De például ha egy egeret és egy elefántot veszünk, akkor egyértelmű, hogy az utódok számának eltérése egynél sokkal nagyobb értékeket érne el. Ismét, minél kevésbé van közös a két mintacsoportban, annál nagyobb eltérésekre lehet számítani.
Ennek ellenére egy dolog világos: ezzel a paraméterrel egy minta adatainak szórását számítjuk ki, de ennek nem kell egy teljes sokaságra reprezentatívnak lennie. Ebben a példában hat szukát fogtunk, de mi lenne, ha hetet figyelnénk meg, és a hetediknek 9 kölyökkutyusa lenne?
Természetesen az eltérés mintája megváltozna. Emiatt vegye figyelembe A minta mérete elengedhetetlen bármely adathalmaz értelmezésekor. Minél több egyedi számot gyűjtünk össze, és minél többször ismételjük meg a kísérletet, annál közelebb kerülünk az általános igazság feltételezéséhez.
következtetéseket
Amint azt megfigyelhettük, a szórás az adatok szórásának mértéke. Minél nagyobb a diszperzió, annál nagyobb lesz ez az érték., mert ha teljesen homogén eredmények halmazával állnánk szemben (vagyis, hogy mindegyik egyenlő lenne az átlaggal), akkor ez a paraméter 0 lenne.
Ennek az értéknek óriási jelentősége van a statisztikában, hiszen nem minden redukálódik az adatok és események közötti közös hidak megtalálására, hanem elengedhetetlen a mintacsoportok közötti variabilitás rögzítése is, hogy minél több kérdést tegyünk fel magunknak, és hosszú távon több tudást szerezzünk. kifejezést.
Bibliográfiai hivatkozások:
- Számítsa ki a szórást lépésről lépésre, khanacademy.org. augusztus 29-én gyűjtötték https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- Jaime, S. és Vinicio, M. (1973). Valószínűség és statisztika.
- Parra, J. m. (1995). Leíró és következtetéses statisztika I. Felépült: http://www. akadémia. edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.
- Rendón-Macías, M. E., Villasis-Keeve, M. Á., & Miranda-Novales, M. g. (2016). Leíró statisztika. Allergy Magazine Mexico, 63(4), 397-407.
- Ricardo, F. K. (2011). Az egészségkutatásra alkalmazott statisztikák. A Khi-négyzet tesztből nyert: http://www. medwave. cl/link. cgi/Medwave/Series/MBE04/5266.