Standardni odklon: kaj je in čemu služi ta ukrep?
Izraz standardna deviacija ali standardni odklon se nanaša na mero, ki se uporablja za količinsko opredelitev variacije ali razpršenosti numeričnih podatkov. v naključni spremenljivki, statistični populaciji, nizu podatkov ali porazdelitvi verjetnosti.
Svet raziskav in statistike se morda zdi zapleten in tuj splošni populaciji, kot se zdi da se matematični izračuni dogajajo pred našimi očmi, ne da bi bili sposobni razumeti osnovne mehanizme sebe. Nič ni dlje od realnosti.
Ob tej priložnosti bomo na preprost, a izčrpen način opisali kontekst, osnova in uporaba izraza, ki je tako bistvenega pomena kot standardna deviacija na področju statistika.
- Sorodni članek: "Psihologija in statistika: pomen verjetnosti v znanosti o vedenju"
Kaj je standardni odklon?
Statistika je veja matematike, ki je odgovorna za beleženje spremenljivosti, pa tudi za naključni proces, ki jo ustvarja. po zakonih verjetnosti. Rečeno je kmalu, a znotraj statističnih procesov so odgovori na vse, kar danes imamo za »dogme« v svetu narave in fizike.
Na primer, recimo, da ko trikrat vržete kovanec, dva prideta na glavo in rep. Preprosto naključje, kajne? Po drugi strani pa, če vržemo isti kovanec 700-krat in jih 660 pristane na glavah, je morda možno, da obstaja dejavnik, ki temu pojavu daje prednost več kot naključnost (predstavljajmo si na primer, da ima čas narediti le omejeno število obratov v zraku, kar pomeni, da skoraj vedno pade v isto način). Tako nas opazovanje vzorcev, ki presegajo zgolj naključje, spodbudi k razmišljanju o temeljnih razlogih za trend.
S tem bizarnim primerom želimo pokazati, da Statistika je bistveno orodje za vsak znanstveni proces., saj na njegovi podlagi lahko ločimo realnosti, ki so posledica naključja, od dogodkov, ki jih urejajo naravni zakoni.
Tako lahko na hitro definiramo standardno deviacijo in rečemo, da je to statistična mera, ki je produkt kvadratnega korena njegove variance. To je kot bi začeli hišo s strehe, saj se za človeka, ki ni povsem posvečen svetu številk, ta definicija in nepoznavanje pojma malo razlikujeta. Vzemimo si torej trenutek in razčlenimo svet osnovnih statističnih vzorcev..
Mere položaja in variabilnosti
Mere položaja so indikatorji, ki se uporabljajo za prikaz, kolikšen odstotek podatkov v frekvenčni porazdelitvi presega te izraze, katerega vrednost predstavlja vrednost podatka, ki je v središču frekvenčne porazdelitve. Ne obupajte, saj jih hitro definiramo:
- Povprečje: številčno povprečje vzorca.
- Mediana: predstavlja vrednost spremenljivke osrednjega položaja v nizu urejenih podatkov.
Na osnovni način bi lahko rekli, da so položajne mere osredotočene na razdelitev nabora podatkov na enake odstotne dele, to je »priti do sredine«.
Po drugi strani pa so odgovorne mere variabilnosti določite stopnjo bližine ali oddaljenosti vrednosti porazdelitve v primerjavi z njeno povprečno lokacijo (tj. v primerjavi s povprečjem). To so naslednji:
- Razpon: meri širino podatkov, to je od najmanjše do največje vrednosti.
- Varianca: pričakovanje (povprečje serije podatkov) kvadrata odstopanja omenjene spremenljivke glede na njeno povprečje.
- Standardni odklon: numerični indeks razpršenosti nabora podatkov.
Seveda se gibljemo v razmeroma zapletenih pogojih za nekoga, ki ni povsem predan svetu matematike. Ne želimo se spuščati v druge mere variabilnosti, saj vemo, da večji kot so numerični produkti teh parametrov, manj homogen bo nabor podatkov.
- Morda vas zanima: "Psihometrija: kaj je in za kaj je odgovorna?"
"Pred netipičnega"
Ko utrdimo znanje o merah variabilnosti in njihovem pomenu pri analizi podatkov, je čas, da svojo pozornost preusmerimo na standardni odklon.
Ne da bi se spuščali v zapletene pojme (in morda zagrešili preveč poenostavljene stvari), lahko rečemo, da ta ukrep je produkt izračuna povprečja vrednosti "izstopajočih".. Za pojasnitev te definicije navedimo primer:
Imamo vzorec šestih brejih psic iste pasme in starosti, ki so ravnokar skotile svoja legla mladičkov hkrati. Trije izmed njih so skotili po 2 mladička, drugi trije pa po 4 mladiče na samico. Seveda je povprečna vrednost potomcev 3 mladiči na samico (vsota vseh mladičev deljena s skupnim številom samic).
Kakšen bi bil standardni odklon v tem primeru? Najprej bi morali od dobljenih vrednosti odšteti povprečje in to številko dvigniti na kvadrat (ker ne želimo negativnih števil), na primer: 4-3=1 ali 2-3= (-1, dvignjen na kvadrat, 1) .
Varianco bi izračunali kot povprečje odstopanj od srednje vrednosti (v tem primeru 3). Tu bi se soočili z varianco, zato moramo vzeti kvadratni koren te vrednosti, da jo pretvorimo v isto numerično lestvico kot povprečje. Po tem bi dobili standardni odklon.
Kakšna bi bila torej standardna deviacija našega primera? Pa kuža. Ocenjuje se, da je povprečje legla trije mladiči, vendar je normalno, da mati skoti enega manj ali enega več na leglo.
Morda bo ta primer zvenel nekoliko zmedeno, kar zadeva varianco in odstopanje (ker je kvadratni koren iz 1 1), če pa bi bila varianca 4, bi bil rezultat standardnega odklona 2 (ne pozabite, njegov koren kvadrat).
S tem primerom smo želeli pokazati, da varianca in standardni odklon sta statistični meri, ki želita pridobiti povprečje vrednosti, ki niso povprečje. Ne pozabite: večja kot je standardna deviacija, večja je razpršenost populacije.
Če se vrnem k prejšnjemu primeru, če so vse psičke iste pasme in imajo podobno težo, je normalno, da je odstopanje en mladič na leglo. Če pa na primer vzamemo miško in slona, je jasno, da bi odstopanje glede števila potomcev doseglo vrednosti, veliko večje od ena. Še enkrat, manj kot imata vzorčni skupini skupnega, večja odstopanja lahko pričakujemo.
Kljub temu je ena stvar jasna: z uporabo tega parametra izračunamo varianco v podatkih vzorca, ni pa nujno, da je ta reprezentativen za celotno populacijo. V tem primeru smo ujeli šest psic, kaj pa če bi jih spremljali sedem in bi imela sedma leglo 9 mladičev?
Seveda bi se vzorec odstopanja spremenil. Iz tega razloga upoštevajte velikost vzorca je bistvena pri interpretaciji katerega koli niza podatkov. Več ko je zbranih posameznih števil in večkrat ko se poskus ponovi, bližje se približamo postuliranju splošne resnice.
zaključki
Kot smo lahko opazili, je standardni odklon merilo razpršenosti podatkov. Večja kot je disperzija, večja bo ta vrednost., kajti če bi bili soočeni z nizom popolnoma homogenih rezultatov (to je, da bi bili vsi enaki povprečju), bi bil ta parameter enak 0.
Ta vrednost je v statistiki izjemnega pomena, saj ni vse omejeno na iskanje skupnih mostov med številkami in dogodki, temveč bistveno je tudi beleženje variabilnosti med vzorčnimi skupinami, da bi si zastavili več vprašanj in dolgoročno pridobili več znanja. termin.
Bibliografske reference:
- Standardni odklon izračunajte korak za korakom, khanacademy.org. Zbrano 29. avgusta v https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- Jaime, S. in Vinicio, M. (1973). Verjetnost in statistika.
- Parra, J. m. (1995). Deskriptivna in inferencialna statistika I. Obnovljeno iz: http://www. akademija. edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.
- Rendón-Macías, M. E., Villasis-Keeve, M. Á., in Miranda-Novales, M. g. (2016). Opisna statistika. Alergijska revija Mehika, 63 (4), 397-407.
- Ricardo, F. Q. (2011). Statistika, uporabljena v zdravstvenih raziskavah. Dobljeno s testom hi-kvadrat: http://www. medwave. cl/povezava. cgi/Medwave/Series/MBE04/5266.