Standardavvik: hva er det og hva er dette tiltaket for?
Begrepet standardavvik eller standardavvik refererer til et mål som brukes til å kvantifisere variasjonen eller spredningen av numeriske data. i en tilfeldig variabel, statistisk populasjon, datasett eller sannsynlighetsfordeling.
Forsknings- og statistikkverdenen kan virke kompleks og fremmed for befolkningen generelt, slik det virker at matematiske beregninger skjer under øynene våre uten at vi kan forstå de underliggende mekanismene til dem selv. Ingenting er lenger unna virkeligheten.
Ved denne anledningen skal vi på en enkel, men uttømmende måte fortelle konteksten, den grunnlag og anvendelse av et begrep som er så vesentlig som standardavviket innen feltet statistikk.
- Relatert artikkel: "Psykologi og statistikk: betydningen av sannsynligheter i vitenskapen om atferd"
Hva er standardavviket?
Statistikk er en gren av matematikk som er ansvarlig for å registrere variabilitet, så vel som den tilfeldige prosessen som genererer den. følge sannsynlighetslovene. Dette sies snart, men innenfor de statistiske prosessene finnes svarene på alt vi i dag anser som «dogmer» i naturens og fysikkens verden.
La oss for eksempel si at når du kaster en mynt tre ganger, kommer to av dem oppover. Enkel tilfeldighet, ikke sant? På den annen side, hvis vi slår den samme mynten 700 ganger og 660 av dem lander på hodet, er det kanskje mulig at det er en faktor som favoriserer dette fenomenet utover tilfeldighet (la oss for eksempel forestille oss at den bare har tid til å gjøre et begrenset antall svinger i luften, noe som betyr at den nesten alltid faller i samme modus). Observasjon av mønstre utover ren tilfeldighet får oss derfor til å tenke på de underliggende årsakene til trenden.
Det vi ønsker å demonstrere med dette bisarre eksemplet er det Statistikk er et viktig verktøy for enhver vitenskapelig prosess., fordi vi basert på den er i stand til å skille realiteter som er et resultat av tilfeldigheter fra hendelser styrt av naturlover.
Dermed kan vi kaste en forhastet definisjon av standardavviket og si at det er et statistisk mål som er produktet av kvadratroten av variansen. Dette er som å starte huset fra taket, for for en person som ikke er helt dedikert til tallenes verden, er denne definisjonen og det å ikke vite noe om begrepet litt annerledes. Så la oss ta et øyeblikk til å dissekere verden av grunnleggende statistiske mønstre..
Mål for posisjon og variasjon
Posisjonsmål er indikatorer som brukes til å indikere hvor stor prosentandel av data innenfor en frekvensfordeling som overstiger disse uttrykkene, hvis verdi representerer verdien av dataene som er i sentrum av frekvensfordelingen. Fortvil ikke, for vi definerer dem raskt:
- Gjennomsnitt: Det numeriske gjennomsnittet av utvalget.
- Median: representerer verdien av den sentrale posisjonsvariabelen i et sett med ordnede data.
På en rudimentær måte kan vi si at posisjonsmål er fokusert på å dele datasettet i like prosentandeler, det vil si å "komme til midten".
På den annen side er mål for variasjon ansvarlig for bestemme graden av nærhet eller avstand til verdiene til en fordeling sammenlignet med dens gjennomsnittlige plassering (dvs. kontra gjennomsnittet). Dette er følgende:
- Område: Måler bredden på dataene, det vil si fra minimum til maksimum verdi.
- Varians: forventningen (gjennomsnittet av dataserien) til kvadratet av avviket til variabelen i forhold til gjennomsnittet.
- Standardavvik: numerisk indeks for spredningen av datasettet.
Selvfølgelig beveger vi oss i relativt komplekse termer for noen som ikke er helt dedikert til matematikkens verden. Vi ønsker ikke å gå inn på andre mål for variabilitet, siden vi vet at jo større numeriske produkter av disse parameterne er, desto mindre homogenisert vil datasettet være.
- Du kan være interessert i: "Psykometri: hva er det og hva er det ansvarlig for?"
"Medel av det atypiske"
Når vi har sementert kunnskapen om målene for variabilitet og deres betydning i dataanalyse, er det på tide å rette oppmerksomheten mot standardavviket.
Uten å gå inn på komplekse konsepter (og kanskje begå synden med å forenkle ting), kan vi si at dette målet er produktet av å beregne gjennomsnittet av "outlier"-verdiene. La oss gi et eksempel for å klargjøre denne definisjonen:
Vi har et utvalg av seks drektige tisper av samme rase og alder som nettopp har født sine valpekull samtidig. Tre av dem har født 2 valper hver, mens ytterligere tre har født 4 valper per tispe. Naturligvis er gjennomsnittsverdien av avkom 3 unger per hunn (summen av alle unger delt på det totale antallet hunner).
Hva vil standardavviket være i dette eksemplet? Først av alt må vi trekke gjennomsnittet fra verdiene som er oppnådd og heve dette tallet til kvadratet (siden vi ikke vil ha negative tall), for eksempel: 4-3=1 eller 2-3= (-1, hevet til torget, 1) .
Variansen vil bli beregnet som gjennomsnittet av avvikene fra middelverdien (i dette tilfellet 3). Her vil vi stå overfor variansen, og derfor må vi ta kvadratroten av denne verdien for å transformere den til samme numeriske skala som gjennomsnittet. Etter dette vil vi få standardavviket.
Så hva ville standardavviket til vårt eksempel være? Vel, en valp. Det anslås at gjennomsnittet for kull er tre avkom, men det er normalt at mor føder én mindre eller én valp mer per kull.
Kanskje dette eksemplet kan høres litt forvirrende ut når det gjelder varians og avvik (siden kvadratroten av 1 er 1), men hvis variansen var 4, ville resultatet av standardavviket være 2 (husk at roten torget).
Det vi ønsket å demonstrere med dette eksemplet er det varians og standardavvik er statistiske mål som søker å oppnå gjennomsnittet av andre verdier enn gjennomsnittet. Husk: jo større standardavvik, jo større spredning av befolkningen.
Går tilbake til forrige eksempel, hvis alle tispene er av samme rase og har lik vekt, er det normalt at avviket er én valp per kull. Men hvis vi for eksempel tar en mus og en elefant, er det klart at avviket når det gjelder antall avkom vil nå verdier som er mye større enn én. Igjen, jo mindre de to utvalgsgruppene har til felles, jo større avvik kan man forvente.
Likevel er én ting klart: Ved å bruke denne parameteren beregner vi variansen i dataene til et utvalg, men dette trenger ikke å være representativt for en hel populasjon. I dette eksemplet har vi fanget seks tisper, men hva om vi overvåket syv og den syvende hadde et kull på 9 valper?
Selvfølgelig ville avviksmønsteret endret seg. Av denne grunn, ta hensyn prøvestørrelse er avgjørende når du tolker et datasett. Jo flere individuelle tall som samles inn og jo flere ganger et eksperiment gjentas, jo nærmere kommer vi til å postulere en generell sannhet.
konklusjoner
Som vi har kunnet observere, er standardavviket et mål på dataspredning. Jo større spredning, jo større vil denne verdien være., fordi hvis vi ble møtt med et sett med helt homogene resultater (det vil si at de alle var lik gjennomsnittet), ville denne parameteren være lik 0.
Denne verdien er av enorm betydning i statistikk, siden ikke alt er redusert til å finne felles broer mellom tall og hendelser, men heller det er også viktig å registrere variasjonen mellom utvalgsgrupper for å stille oss selv flere spørsmål og få mer kunnskap på sikt. begrep.
Bibliografiske referanser:
- Beregn standardavviket trinn for trinn, khanacademy.org. Samlet 29. august i https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- Jaime, S., & Vinicio, M. (1973). Sannsynlighet og statistikk.
- Parra, J. m. (1995). Beskrivende og inferensiell statistikk I. Kommet seg fra: http://www. akademi. edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.
- Rendón-Macías, M. E., Villasis-Keeve, M. Á., & Miranda-Novales, M. g. (2016). Beskrivende statistikk. Allergy Magazine Mexico, 63(4), 397-407.
- Ricardo, F. Q. (2011). Statistikk brukt på helseforskning. Innhentet fra Chi-Square-testen: http://www. medbølge. cl/lenke. cgi/Medwave/Series/MBE04/5266.