Abaterea standard: ce este și pentru ce este această măsură?
Termenul abatere standard sau abatere standard se referă la o măsură care este utilizată pentru a cuantifica variația sau dispersia datelor numerice. într-o variabilă aleatorie, populație statistică, set de date sau distribuție de probabilitate.
Lumea cercetării și statisticii poate părea complexă și străină populației generale, așa cum pare că calculele matematice au loc sub ochii noștri fără ca noi să putem înțelege mecanismele de bază ale înșiși. Nimic mai departe de realitate.
Cu această ocazie vom relata într-un mod simplu, dar exhaustiv contextul, cel întemeierea şi aplicarea unui termen la fel de esenţial ca abaterea standard în domeniul statistici.
- Articol înrudit: „Psihologie și statistică: importanța probabilităților în știința comportamentului”
Care este abaterea standard?
Statistica este o ramură a matematicii care este responsabilă pentru înregistrarea variabilității, precum și a procesului aleator care o generează. urmând legile probabilității. Acest lucru se spune în curând, dar în cadrul proceselor statistice se află răspunsurile la tot ceea ce astăzi considerăm „dogme” în lumea naturii și a fizicii.
De exemplu, să presupunem că atunci când aruncați o monedă de trei ori, două dintre ele ies cu cap și coadă. Simplă coincidență, nu? Pe de altă parte, dacă aruncăm aceeași monedă de 700 de ori și 660 dintre ele aterizează pe capete, poate că este posibil să existe un factor care favorizează acest fenomen dincolo de aleatorie (să ne imaginăm, de exemplu, că are timp doar să facă un număr limitat de ture în aer, ceea ce înseamnă că aproape întotdeauna cade în același modul). Astfel, observarea tiparelor dincolo de simpla coincidență ne determină să ne gândim la motivele care stau la baza tendinței.
Ceea ce vrem să demonstrăm cu acest exemplu bizar este că Statistica este un instrument esențial pentru orice proces științific., deoarece pe baza ei suntem capabili să distingem realitățile care sunt rezultatul întâmplării de evenimentele guvernate de legile naturale.
Astfel, putem arunca o definiție grăbită a abaterii standard și putem spune că este o măsură statistică care este produsul rădăcinii pătrate a varianței sale. Este ca și cum ai începe casa de pe acoperiș, pentru că pentru o persoană care nu este în întregime dedicată lumii numerelor, această definiție și a nu ști nimic despre termen sunt puțin diferite. Deci, să luăm un moment pentru a diseca lumea modelelor statistice de bază..
Măsuri de poziție și variabilitate
Măsurile de poziție sunt indicatori utilizați pentru a indica ce procent de date dintr-o distribuție de frecvență depășește aceste expresii, a cărui valoare reprezintă valoarea datelor care se află în centrul distribuţiei de frecvenţă. Nu disperați, pentru că le definim rapid:
- Media: media numerică a eșantionului.
- Mediană: reprezintă valoarea variabilei de poziție centrală într-un set de date ordonate.
Într-un mod rudimentar, am putea spune că măsurile de poziție sunt concentrate pe împărțirea setului de date în părți procentuale egale, adică „a ajunge la mijloc”.
Pe de altă parte, măsurile de variabilitate sunt responsabile pentru determinați gradul de apropiere sau distanța valorilor unei distribuții în comparație cu locația medie a acesteia (adică, față de medie). Acestea sunt următoarele:
- Interval: Măsoară lățimea datelor, adică de la valoarea minimă la cea maximă.
- Varianta: așteptarea (media seriei de date) a pătratului abaterii respectivei variabile în raport cu media acesteia.
- Abaterea standard: indicele numeric al dispersiei setului de date.
Desigur, ne mișcăm în termeni relativ complexi pentru cineva care nu este pe deplin dedicat lumii matematicii. Nu dorim să intrăm în alte măsuri de variabilitate, deoarece știind că cu cât produsele numerice ale acestor parametri sunt mai mari, cu atât setul de date va fi mai puțin omogenizat.
- Ați putea fi interesat de: „Psihometria: ce este și de ce este responsabilă?”
„Mijlocul atipicului”
Odată ce am cimentat cunoașterea măsurilor de variabilitate și importanța acestora în analiza datelor, este timpul să ne reorientăm atenția asupra abaterii standard.
Fără a intra în concepte complexe (și poate să comită păcatul simplificării excesive a lucrurilor), putem spune că această măsură este produsul calculării mediei valorilor „outlier”.. Să dăm un exemplu pentru a clarifica această definiție:
Avem un eșantion de șase cățele gestante de aceeași rasă și vârstă care tocmai și-au născut puii de căței simultan. Trei dintre ei au născut câte 2 căței fiecare, în timp ce alți trei au dat naștere la 4 căței per femelă. Desigur, valoarea medie a puilor este de 3 pui per femelă (suma tuturor puilor împărțită la numărul total de femele).
Care ar fi abaterea standard în acest exemplu? În primul rând, ar trebui să scădem media din valorile obținute și să ridicăm această cifră la pătrat (din moment ce nu vrem numere negative), de exemplu: 4-3=1 sau 2-3= (-1, ridicat la pătrat, 1) .
Varianta ar fi calculată ca medie a abaterilor de la valoarea medie (în acest caz, 3). Aici ne-am confrunta cu varianța și, prin urmare, trebuie să luăm rădăcina pătrată a acestei valori pentru a o transforma în aceeași scară numerică ca media. După aceasta vom obține abaterea standard.
Deci, care ar fi abaterea standard a exemplului nostru? Ei bine, un cățel. Se estimează că media pentru puii este de trei pui, dar este normal ca mama să nască câte un pui în minus sau mai mult pe pui.
Poate că acest exemplu ar putea suna puțin confuz în ceea ce privește variația și abaterea (deoarece rădăcina pătrată a lui 1 este 1), dar dacă varianța ar fi 4, rezultatul abaterii standard ar fi 2 (rețineți că rădăcina sa pătrat).
Ceea ce am vrut să demonstrăm cu acest exemplu este că varianța și abaterea standard sunt măsuri statistice care urmăresc să obțină media valorilor, altele decât media. Amintiți-vă: cu cât abaterea standard este mai mare, cu atât este mai mare dispersia populației.
Revenind la exemplul anterior, dacă toate cățelele sunt de aceeași rasă și au greutăți similare, este normal ca abaterea să fie de un pui pe puiă. Dar, de exemplu, dacă luăm un șoarece și un elefant, este clar că abaterea în ceea ce privește numărul de descendenți ar atinge valori mult mai mari decât unu. Din nou, cu cât cele două grupuri de eșantion au mai puține în comun, cu atât se pot aștepta abateri mai mari.
Chiar și așa, un lucru este clar: folosind acest parametru calculăm varianța datelor dintr-un eșantion, dar aceasta nu trebuie să fie reprezentativă pentru întreaga populație. În acest exemplu am prins șase cățele, dar dacă am monitoriza șapte și a șaptea ar avea un pui de 9 căței?
Desigur, modelul de abatere s-ar schimba. Din acest motiv, luați în considerare dimensiunea eșantionului este esențială atunci când se interpretează orice set de date. Cu cât sunt colectate mai multe numere individuale și cu cât un experiment este repetat de mai multe ori, cu atât ne apropiem de postularea unui adevăr general.
concluzii
După cum am putut observa, abaterea standard este o măsură a dispersiei datelor. Cu cât dispersia este mai mare, cu atât această valoare va fi mai mare., deoarece dacă ne-am confrunta cu un set de rezultate complet omogene (adică toate sunt egale cu media), acest parametru ar fi egal cu 0.
Această valoare este de o importanță enormă în statistică, deoarece nu totul se reduce la găsirea de punți comune între cifre și evenimente, ci mai degrabă de asemenea, este esențial să înregistrăm variabilitatea dintre grupurile de eșantion pentru a ne pune mai multe întrebări și a obține mai multe cunoștințe pe termen lung. termen.
Referințe bibliografice:
- Calculați abaterea standard pas cu pas, khanacademy.org. Colectat pe 29 august în https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- Jaime, S. și Vinicio, M. (1973). Probabilitate și statistică.
- Parra, J. m. (1995). Statistica descriptivă și inferențială I. Recuperat din: http://www. academie. edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.
- Rendón-Macías, M. E., Villasis-Keeve, M. Á. și Miranda-Novales, M. g. (2016). Statisticile descriptive. Revista Alergie Mexic, 63(4), 397-407.
- Ricardo, F. Q. (2011). Statistica aplicată cercetării în sănătate. Obținut din testul Chi-pătrat: http://www. medwave. cl/link. cgi/Medwave/Series/MBE04/5266.