Standardafvigelse: hvad er det, og hvad er dette mål til?
Udtrykket standardafvigelse eller standardafvigelse refererer til et mål, der bruges til at kvantificere variationen eller spredningen af numeriske data. i en tilfældig variabel, statistisk population, datasæt eller sandsynlighedsfordeling.
Forskningens og statistikkens verden kan virke kompleks og fremmed for den brede befolkning, som det ser ud til at matematiske beregninger sker under vores øjne, uden at vi er i stand til at forstå de bagvedliggende mekanismer dem selv. Intet er længere fra virkeligheden.
Ved denne lejlighed vil vi på en enkel, men udtømmende måde fortælle konteksten, den grundlag og anvendelse af et så væsentligt udtryk som standardafvigelsen inden for Statistikker.
- Relateret artikel: "Psykologi og statistik: betydningen af sandsynligheder i videnskaben om adfærd"
Hvad er standardafvigelsen?
Statistik er en gren af matematik, der er ansvarlig for registrering af variabilitet, såvel som den tilfældige proces, der genererer den. efter sandsynlighedslovene. Dette er sagt snart, men inden for de statistiske processer er svarene på alt, hvad vi i dag betragter som "dogmer" i naturens og fysikkens verden.
Lad os f.eks. sige, at når man kaster en mønt tre gange, kommer to af dem op med hoveder og haler. Simpel tilfældighed, ikke? På den anden side, hvis vi vender den samme mønt 700 gange, og 660 af dem lander på hoveder, er det måske muligt, at der er en faktor, der favoriserer dette fænomen ud over tilfældighed (lad os f.eks. forestille os, at den kun når at lave et begrænset antal drejninger i luften, hvilket betyder, at den næsten altid falder i samme mode). At observere mønstre ud over blot tilfældigheder får os således til at tænke over de underliggende årsager til tendensen.
Det, vi ønsker at demonstrere med dette bizarre eksempel, er det Statistik er et vigtigt værktøj for enhver videnskabelig proces., fordi vi ud fra den er i stand til at skelne realiteter, der er et resultat af tilfældigheder, fra begivenheder styret af naturlove.
Således kan vi kaste en forhastet definition af standardafvigelsen og sige, at det er et statistisk mål, der er produktet af kvadratroden af dens varians. Det er som at starte huset fra taget, for for en person, der ikke er helt dedikeret til tallenes verden, er denne definition og ikke at vide noget om udtrykket lidt anderledes. Så lad os tage et øjeblik på at dissekere verden af grundlæggende statistiske mønstre..
Mål for position og variabilitet
Positionsmål er indikatorer, der bruges til at angive, hvor stor en procentdel af data inden for en frekvensfordeling, der overstiger disse udtryk, hvis værdi repræsenterer værdien af de data, der er i centrum af frekvensfordelingen. Fortvivl ikke, for vi definerer dem hurtigt:
- Gennemsnit: Det numeriske gennemsnit af prøven.
- Median: repræsenterer værdien af den centrale positionsvariabel i et sæt ordnede data.
På en rudimentær måde kan vi sige, at positionsmål er fokuseret på at opdele datasættet i lige store procentdele, det vil sige at "komme til midten".
På den anden side er mål for variabilitet ansvarlige for bestemme graden af nærhed eller afstand af værdierne af en fordeling sammenlignet med dens gennemsnitlige placering (dvs. versus gennemsnittet). Disse er følgende:
- Område: Måler bredden af dataene, det vil sige fra minimum til maksimum værdi.
- Varians: Forventningen (middelværdien af dataserien) af kvadratet af variablens afvigelse i forhold til dens middelværdi.
- Standardafvigelse: numerisk indeks for spredningen af datasættet.
Selvfølgelig bevæger vi os i relativt komplekse termer for en, der ikke er fuldt dedikeret til matematikkens verden. Vi ønsker ikke at gå ind på andre mål for variabilitet, da velvidende, at jo større de numeriske produkter af disse parametre er, jo mindre homogeniseret vil datasættet være.
- Du kan være interesseret i: "Psykometri: hvad er det, og hvad er det ansvarligt for?"
"Middel af det atypiske"
Når vi har cementeret kendskabet til målene for variabilitet og deres betydning i dataanalyse, er det tid til at genfokusere vores opmærksomhed på standardafvigelsen.
Uden at gå ind i komplekse begreber (og måske begå synden at forsimplificere ting), kan vi sige, at dette mål er produktet af at beregne middelværdien af "outlier"-værdierne. Lad os give et eksempel for at tydeliggøre denne definition:
Vi har en prøve på seks drægtige tæver af samme race og alder, som lige har født deres hvalpekuld samtidigt. Tre af dem har født 2 hvalpe hver, mens yderligere tre har født 4 hvalpe per hun. Naturligvis er middelværdien af afkom 3 unger pr. hun (summen af alle unger divideret med det samlede antal hunner).
Hvad ville standardafvigelsen være i dette eksempel? Først og fremmest skal vi trække middelværdien fra de opnåede værdier og hæve dette tal til kvadratet (da vi ikke ønsker negative tal), for eksempel: 4-3=1 eller 2-3= (-1), hævet til pladsen, 1) .
Variansen ville blive beregnet som middelværdien af afvigelserne fra middelværdien (i dette tilfælde 3). Her ville vi stå over for variansen, og derfor er vi nødt til at tage kvadratroden af denne værdi for at transformere den til den samme numeriske skala som middelværdien. Efter dette ville vi opnå standardafvigelsen.
Så hvad ville standardafvigelsen i vores eksempel være? Nå, en hvalp. Det anslås, at gennemsnittet for kuld er tre afkom, men det er normalt, at moderen føder én mindre eller én hvalp mere pr. kuld.
Måske kan dette eksempel lyde lidt forvirrende med hensyn til varians og afvigelse (da kvadratroden af 1 er 1), men hvis variansen var 4, ville resultatet af standardafvigelsen være 2 (husk dens rod firkant).
Det, vi ønskede at demonstrere med dette eksempel, er det varians og standardafvigelse er statistiske mål, der søger at opnå middelværdien af andre værdier end middelværdien. Husk: Jo større standardafvigelse, jo større spredning af befolkningen.
Går vi tilbage til det forrige eksempel, hvis alle tæverne er af samme race og har ens vægt, er det normalt, at afvigelsen er én hvalp pr. kuld. Men hvis vi for eksempel tager en mus og en elefant, er det klart, at afvigelsen med hensyn til antallet af afkom vil nå værdier meget større end én. Igen, jo mindre de to stikprøvegrupper har til fælles, jo større afvigelser kan forventes.
Alligevel er én ting klar: Ved hjælp af denne parameter beregner vi variansen i dataene for en stikprøve, men dette behøver ikke at være repræsentativt for en hel population. I dette eksempel har vi fanget seks tæver, men hvad nu hvis vi overvågede syv og den syvende fik et kuld på 9 hvalpe?
Selvfølgelig ville afvigelsesmønstret ændre sig. Af denne grund skal du tage højde for stikprøvestørrelse er afgørende, når der skal fortolkes et datasæt. Jo flere individuelle tal, der indsamles, og jo flere gange et eksperiment gentages, jo tættere kommer vi på at postulere en generel sandhed.
konklusioner
Som vi har kunnet observere, er standardafvigelsen et mål for dataspredning. Jo større spredning, jo større vil denne værdi være., fordi hvis vi stod over for et sæt af fuldstændig homogene resultater (det vil sige, at de alle var lig med middelværdien), ville denne parameter være lig med 0.
Denne værdi er af enorm betydning i statistik, da ikke alt er reduceret til at finde fælles broer mellem tal og begivenheder, men snarere det er også vigtigt at registrere variabiliteten mellem stikprøvegrupper for at stille os selv flere spørgsmål og opnå mere viden på længere sigt. semester.
Bibliografiske referencer:
- Beregn standardafvigelsen trin for trin, khanacademy.org. Afhentet den 29. august i https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- Jaime, S., & Vinicio, M. (1973). Sandsynlighed og statistik.
- Parra, J. m. (1995). Beskrivende og inferentiel statistik I. Genvundet fra: http://www. akademi. edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.
- Rendón-Macías, M. E., Villasis-Keeve, M. Á., & Miranda-Novales, M. g. (2016). Beskrivende statistik. Allergy Magazine Mexico, 63(4), 397-407.
- Ricardo, F. Q. (2011). Statistik anvendt til sundhedsforskning. Opnået fra Chi-Square testen: http://www. medbølge. cl/link. cgi/Medwave/Series/MBE04/5266.