Education, study and knowledge

Standardavvikelse: vad är det och vad är detta mått för?

Termen standardavvikelse eller standardavvikelse syftar på ett mått som används för att kvantifiera variationen eller spridningen av numeriska data. i en slumpvariabel, statistisk population, datauppsättning eller sannolikhetsfördelning.

Forsknings- och statistikvärlden kan verka komplex och främmande för den allmänna befolkningen, som det verkar att matematiska beräkningar sker under våra ögon utan att vi kan förstå de bakomliggande mekanismerna för sig själva. Inget är längre från verkligheten.

Vid detta tillfälle kommer vi på ett enkelt men uttömmande sätt att berätta om sammanhanget grunden och tillämpningen av en term lika väsentlig som standardavvikelsen inom området statistik.

  • Relaterad artikel: "Psykologi och statistik: betydelsen av sannolikheter i vetenskapen om beteende"

Vad är standardavvikelsen?

Statistik är en gren av matematiken som är ansvarig för att registrera variabilitet, såväl som den slumpmässiga process som genererar den. följa sannolikhetslagarna. Detta sägs snart, men inom de statistiska processerna finns svaren på allt som vi idag betraktar som "dogmer" i naturens och fysikens värld.

instagram story viewer

Låt oss till exempel säga att när man kastar ett mynt tre gånger kommer två av dem upp med huvuden och svansen. Enkel slump, eller hur? Å andra sidan, om vi slår samma mynt 700 gånger och 660 av dem landar på huvuden, kanske det är möjligt att det finns en faktor som gynnar detta fenomen bortom slumpmässighet (låt oss till exempel föreställa oss att den bara hinner göra ett begränsat antal varv i luften, vilket gör att den nästan alltid faller i samma läge). Att observera mönster bortom enbart tillfälligheter får oss alltså att tänka på de bakomliggande orsakerna till trenden.

Vad vi vill visa med detta bisarra exempel är det Statistik är ett viktigt verktyg för alla vetenskapliga processer., eftersom vi utifrån det kan särskilja verkligheter som är resultatet av slumpen från händelser som styrs av naturlagar.

Således kan vi kasta en förhastad definition av standardavvikelsen och säga att det är ett statistiskt mått som är produkten av kvadratroten av dess varians. Det här är som att starta huset från taket, för för en person som inte är helt dedikerad till siffrornas värld är denna definition och att inte veta något om termen lite annorlunda. Så låt oss ta en stund för att dissekera världen av grundläggande statistiska mönster..

Mått på position och variabilitet

Positionsmått är indikatorer som används för att indikera hur stor procentandel av data inom en frekvensfördelning som överstiger dessa uttryck, vars värde representerar värdet på data som finns i mitten av frekvensfördelningen. Misströsta inte, för vi definierar dem snabbt:

  • Medelvärde: Det numeriska medelvärdet av urvalet.
  • Median: representerar värdet på den centrala positionsvariabeln i en uppsättning ordnade data.

På ett rudimentärt sätt skulle vi kunna säga att positionsmått är fokuserade på att dela upp datamängden i lika procentuella delar, det vill säga att "komma till mitten".

Å andra sidan är mått på variabilitet ansvariga för bestämma graden av närhet eller avstånd för värdena för en fördelning jämfört med dess genomsnittliga plats (dvs kontra medelvärdet). Dessa är följande:

  • Område: Mäter bredden på data, det vill säga från det lägsta till det högsta värdet.
  • Varians: förväntan (medelvärdet av dataserien) på kvadraten på avvikelsen för nämnda variabel i förhållande till dess medelvärde.
  • Standardavvikelse: numeriskt index för spridningen av datamängden.

Naturligtvis rör vi oss i relativt komplexa termer för någon som inte är helt dedikerad till matematikens värld. Vi vill inte gå in på andra mått på variabilitet, eftersom att veta att ju större numeriska produkter av dessa parametrar är, desto mindre homogeniserad blir datauppsättningen.

  • Du kanske är intresserad av: "Psykometri: vad är det och vad är det ansvarigt för?"

"Mean of the Atypical"

När vi väl har cementerat kunskapen om måtten på variabilitet och deras betydelse i dataanalys är det dags att åter fokusera vår uppmärksamhet på standardavvikelsen.

Utan att gå in på komplexa begrepp (och kanske begå synden att förenkla saker) kan vi säga att detta mått är produkten av beräkningen av medelvärdet av de "avvikande" värdena. Låt oss ge ett exempel för att förtydliga denna definition:

Vi har ett urval av sex dräktiga tikar av samma ras och ålder som precis har fött sina valpkullar samtidigt. Tre av dem har fött 2 valpar var, medan ytterligare tre har fött 4 valpar per hona. Naturligtvis är medelvärdet för avkommor 3 ungar per hona (summan av alla ungar dividerat med det totala antalet honor).

Vad skulle standardavvikelsen vara i detta exempel? Först och främst måste vi subtrahera medelvärdet från de erhållna värdena och höja denna siffra till kvadraten (eftersom vi inte vill ha negativa tal), till exempel: 4-3=1 eller 2-3= (-1), upphöjd till torget, 1) .

Variansen skulle beräknas som medelvärdet av avvikelserna från medelvärdet (i det här fallet 3). Här skulle vi stå inför variansen, och därför måste vi ta kvadratroten av detta värde för att omvandla det till samma numeriska skala som medelvärdet. Efter detta skulle vi få standardavvikelsen.

Så vad skulle standardavvikelsen för vårt exempel vara? Tja, en valp. Det uppskattas att medeltalet för kullar är tre avkommor, men det är normalt att mamman föder en mindre eller en valp mer per kull.

Det här exemplet kanske låter lite förvirrande när det gäller varians och avvikelse (eftersom kvadratroten ur 1 är 1), men om variansen var 4, skulle resultatet av standardavvikelsen vara 2 (kom ihåg att dess rot fyrkant).

Det vi ville visa med detta exempel är att varians och standardavvikelse är statistiska mått som försöker erhålla medelvärdet av andra värden än medelvärdet. Kom ihåg: ju större standardavvikelse, desto större spridning av befolkningen.

Om vi ​​går tillbaka till föregående exempel, om alla tikar är av samma ras och har liknande vikt, är det normalt att avvikelsen är en valp per kull. Men om vi till exempel tar en mus och en elefant, är det klart att avvikelsen när det gäller antalet avkommor skulle nå värden mycket större än ett. Återigen, ju mindre de två urvalsgrupperna har gemensamt, desto större avvikelser kan förväntas.

Trots det är en sak klar: med den här parametern beräknar vi variansen i data från ett urval, men detta behöver inte vara representativt för en hel population. I det här exemplet har vi fångat sex tikar, men vad händer om vi övervakade sju och den sjunde fick en kull på 9 valpar?

Naturligtvis skulle avvikelsens mönster förändras. Av denna anledning, ta hänsyn urvalsstorleken är avgörande vid tolkning av datauppsättningar. Ju fler individuella siffror som samlas in och ju fler gånger ett experiment upprepas, desto närmare kommer vi att postulera en allmän sanning.

Slutsatser

Som vi har kunnat observera är standardavvikelsen ett mått på dataspridning. Ju större spridning, desto större blir detta värde., för om vi stod inför en uppsättning helt homogena resultat (det vill säga att de alla var lika med medelvärdet), skulle denna parameter vara lika med 0.

Detta värde är av enorm betydelse i statistik, eftersom inte allt reduceras till att hitta gemensamma broar mellan siffror och händelser, utan snarare Det är också viktigt att registrera variationen mellan urvalsgrupperna för att ställa fler frågor till oss själva och få mer kunskap på sikt. termin.

Bibliografiska referenser:

  • Beräkna standardavvikelsen steg för steg, khanacademy.org. Hämtas den 29 augusti in https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
  • Jaime, S., & Vinicio, M. (1973). Sannolikhet och statistik.
  • Parra, J. m. (1995). Beskrivande och inferentiell statistik I. Återhämtad från: http://www. akademi. edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.
  • Rendón-Macías, M. E., Villasis-Keeve, M. Á., & Miranda-Novales, M. g. (2016). Beskrivande statistik. Allergy Magazine Mexiko, 63(4), 397-407.
  • Ricardo, F. F. (2011). Statistik tillämpad på hälsoforskning. Erhållen från Chi-Square-testet: http://www. medvåg. cl/länk. cgi/Medwave/Series/MBE04/5266.

Informativ text: vad det är, egenskaper och hur man gör det

Kommunikation har blivit ett mycket värdefullt, viktigt och lukrativt verktyg genom åren och med ...

Läs mer

De 12 viktigaste grekiska gudarna (sammanfattning av deras liv)

De 12 viktigaste grekiska gudarna (sammanfattning av deras liv)

Grekisk mytologi är den mest kända av alla berättelser och berättelser om de antika civilisatione...

Läs mer

20 Biologiböcker för nybörjare

20 Biologiböcker för nybörjare

Fenomenet med livets uppkomst är något som när människor väcker intresse för oss, antingen för at...

Läs mer