Education, study and knowledge

Keskihajonta: mikä se on ja mihin tämä mitta on tarkoitettu?

Termi keskihajonta tai keskihajonta viittaa mittaan, jota käytetään numeeristen tietojen vaihtelun tai hajaantumisen kvantifiointiin. satunnaismuuttujassa, tilastollisessa perusjoukossa, tietojoukossa tai todennäköisyysjakaumassa.

Tutkimuksen ja tilastojen maailma saattaa näyttää monimutkaiselta ja vieraalta suurelle väestölle, kuten se näyttää että matemaattiset laskelmat tapahtuvat silmiemme alla ilman, että pystymme ymmärtämään sen taustalla olevia mekanismeja itse. Mikään ei ole kauempana todellisuudesta.

Tässä yhteydessä käsittelemme yksinkertaisella mutta tyhjentävällä tavalla kontekstia alan keskihajonnan kaltaisen olennaisen termin perustaminen ja soveltaminen tilastot.

  • Aiheeseen liittyvä artikkeli: "Psykologia ja tilastot: todennäköisyyksien merkitys käyttäytymistieteessä"

Mikä on keskihajonta?

Tilastot on matematiikan haara, joka vastaa vaihteluisuuden tallentamisesta sekä sen luovasta satunnaisprosessista. noudattamalla todennäköisyyslakeja. Tämä sanotaan pian, mutta tilastollisten prosessien sisällä on vastauksia kaikkeen, mitä nykyään pidämme "dogmoina" luonnon ja fysiikan maailmassa.

Oletetaan esimerkiksi, että kun heität kolikkoa kolme kertaa, kaksi niistä nousee päätä ja häntää vastaan. Yksinkertainen sattuma, eikö? Toisaalta, jos heitämme samaa kolikkoa 700 kertaa ja niistä 660 osuu päähän, ehkä on mahdollista, että jokin tekijä suosii tätä ilmiötä muuallakin. satunnaisuus (kuvitelkaamme esimerkiksi, että sillä on aikaa tehdä vain rajoitettu määrä kierroksia ilmassa, mikä tarkoittaa, että se putoaa melkein aina samaan tila). Näin ollen kuvioiden havaitseminen pelkän sattuman lisäksi saa meidät pohtimaan trendin taustalla olevia syitä.

Haluamme osoittaa tällä oudolla esimerkillä sen Tilastot ovat olennainen työkalu kaikissa tieteellisissä prosesseissa., koska sen perusteella pystymme erottamaan sattuman tuloksena syntyneet todellisuudet luonnonlakien säätelemistä tapahtumista.

Siten voimme heittää keskihajonnan hätäisen määritelmän ja sanoa, että se on tilastollinen mitta, joka on sen varianssin neliöjuuren tulo. Tämä on kuin talon aloittaminen katolta, koska henkilölle, joka ei ole täysin omistautunut numeroiden maailmaan, tämä määritelmä ja termistä mitään tietämättömyys ovat vähän erilaisia. Otetaan siis hetki tilastollisten perusmallien maailman erittelyyn..

Asennon ja vaihtelevuuden mittarit

Paikkamitat ovat indikaattoreita, joita käytetään osoittamaan, kuinka suuri prosenttiosuus tiheysjakauman tiedoista ylittää nämä lausekkeet, jonka arvo edustaa taajuusjakauman keskellä olevan datan arvoa. Älä vaivu epätoivoon, sillä määrittelemme ne nopeasti:

  • Keskiarvo: Otoksen numeerinen keskiarvo.
  • Mediaani: edustaa keskeisen sijaintimuuttujan arvoa järjestetyssä datajoukossa.

Alkeellisella tavalla voisi sanoa, että asemamittaukset keskittyvät tietojoukon jakamiseen yhtä suuriin prosenttiosuuksiin eli "keskikohtaan pääsemiseen".

Toisaalta vaihtelumitat ovat vastuussa määrittää jakauman arvojen läheisyyden tai etäisyyden asteen verrattuna sen keskimääräiseen sijaintiin (eli verrattuna keskiarvoon). Nämä ovat seuraavat:

  • Alue: Mittaa datan leveyden, eli minimiarvosta enimmäisarvoon.
  • Varianssi: Odotus (tietosarjan keskiarvo) mainitun muuttujan poikkeaman neliöstä suhteessa sen keskiarvoon.
  • Keskihajonta: tietojoukon hajaantumisen numeerinen indeksi.

Tietenkin toimimme suhteellisen monimutkaisilla termeillä henkilölle, joka ei ole täysin omistautunut matematiikan maailmaan. Emme halua mennä muihin vaihtelumittauksiin, koska tietäen, että mitä suuremmat näiden parametrien numeeriset tulot ovat, sitä vähemmän homogenisoitua tietojoukko on.

  • Saatat olla kiinnostunut: "Psykometria: mitä se on ja mistä se vastaa?"

"Epätyypillisten keskiarvo"

Kun olemme vahvistaneet tietämystä vaihtelevuuden mittareista ja niiden merkityksestä data-analyysissä, on aika keskittää huomiomme keskihajontaan.

Menemättä monimutkaisiin käsitteisiin (ja kenties syyllistymättä asioiden liialliseen yksinkertaistamiseen), voimme sanoa sen tämä mitta on "outlier"-arvojen keskiarvon laskemisen tulos. Annetaan esimerkki tämän määritelmän selventämiseksi:

Meillä on näyte kuudesta saman rodun ja ikäisestä tiineestä nartusta, jotka ovat juuri synnyttäneet pentueensa samanaikaisesti. Kolme heistä on synnyttänyt kukin 2 pentua, kun taas toiset kolme ovat synnyttäneet 4 pentua per naaras. Luonnollisesti jälkeläisten keskiarvo on 3 pentua per naaras (kaikkien pentujen summa jaettuna naaraiden kokonaismäärällä).

Mikä olisi keskihajonta tässä esimerkissä? Ensinnäkin meidän pitäisi vähentää keskiarvo saaduista arvoista ja nostaa tämä luku neliöön (koska emme halua negatiivisia lukuja), esimerkiksi: 4-3=1 tai 2-3= (-1, nostettu neliöön, 1) .

Varianssi laskettaisiin keskiarvosta poikkeamien keskiarvona (tässä tapauksessa 3). Tässä kohtaamme varianssin, ja siksi meidän on otettava tämän arvon neliöjuuri, jotta se muunnetaan samalle numeeriselle asteikolle kuin keskiarvo. Tämän jälkeen saamme keskihajonnan.

Joten mikä olisi esimerkkimme keskihajonnan? No, pentu. Pentueiden keskiarvon on arvioitu olevan kolme jälkeläistä, mutta on normaalia, että emo synnyttää yhden vähemmän tai yhden pennun enemmän per pentue.

Ehkä tämä esimerkki saattaa kuulostaa hieman hämmentävältä varianssin ja poikkeaman suhteen (koska 1:n neliöjuuri on 1), mutta jos varianssi olisi 4, keskihajonnan tulos olisi 2 (muista, sen juuri neliö).

Halusimme osoittaa tällä esimerkillä sen varianssi ja keskihajonta ovat tilastollisia mittareita, joilla pyritään saamaan muiden arvojen keskiarvo kuin keskiarvo. Muista: mitä suurempi keskihajonta, sitä suurempi on populaation hajonta.

Palatakseni edelliseen esimerkkiin, jos kaikki nartut ovat samaa rotua ja samanpainoisia, on normaalia, että poikkeama on yksi pentu per pentue. Mutta jos otamme esimerkiksi hiiren ja norsun, on selvää, että poikkeama jälkeläisten lukumäärässä saavuttaisi arvoja, jotka ovat paljon suurempia kuin yksi. Jälleen, mitä vähemmän kahdella näyteryhmällä on yhteistä, sitä suurempia poikkeamia voidaan odottaa.

Yksi asia on kuitenkin selvä: tällä parametrilla laskemme otoksen tietojen varianssia, mutta tämän ei tarvitse edustaa koko populaatiota. Tässä esimerkissä olemme saaneet kuusi narttua, mutta entä jos seuraisimme seitsemän ja seitsemännellä olisi 9 pentue?

Tietysti poikkeamamalli muuttuisi. Tästä syystä ota huomioon otoskoko on olennainen mitä tahansa tietojoukkoa tulkittaessa. Mitä enemmän yksittäisiä lukuja kerätään ja mitä useammin koe toistetaan, sitä lähempänä yleisen totuuden olettamista pääsemme.

johtopäätöksiä

Kuten olemme voineet havaita, keskihajonta on tiedon hajaantumisen mitta. Mitä suurempi dispersio, sitä suurempi tämä arvo on., koska jos kohtaisimme joukon täysin homogeenisia tuloksia (eli että ne ovat kaikki yhtä suuret kuin keskiarvo), tämä parametri olisi yhtä suuri kuin 0.

Tällä arvolla on valtava merkitys tilastoissa, koska kaikki ei rajoitu yhteisten siltojen löytämiseen lukujen ja tapahtumien välillä, vaan pikemminkin Olennaista on myös kirjata näyteryhmien välinen vaihtelu, jotta voimme kysyä itseltämme enemmän ja saada lisää tietoa pitkällä aikavälillä. termi.

Bibliografiset viittaukset:

  • Laske keskihajonta askel askeleelta, khanacademy.org. Kerätty 29. elokuuta https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
  • Jaime, S. ja Vinicio, M. (1973). Todennäköisyys ja tilastot.
  • Parra, J. m. (1995). Kuvailevat ja päättelevät tilastot I. Palautettu kohteesta: http://www. akatemia. edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.
  • Rendón-Macías, M. E., Villasis-Keeve, M. Á. & Miranda-Novales, M. g. (2016). Kuvailevia tilastoja. Allergy Magazine Mexico, 63(4), 397-407.
  • Ricardo, F. K. (2011). Terveystutkimukseen sovellettavat tilastot. Saatu Chi-Square-testistä: http://www. medwave. cl/linkki. cgi/Medwave/Series/MBE04/5266.

10 suosituinta meksikolaista myyttiä (ja mitä ne tarkoittavat)

Meksiko on maa, joka liittyy läheisesti kulttuuriin, kansanperinteeseen ja perinteisiin. On myytt...

Lue lisää

17 tyyppistä loogista ja argumentoitua harhaa

Onko mahdollista saada logiikan vastaisia ​​argumentteja? Se ei näytä olevan jotain täysin mahdol...

Lue lisää

30 suosituinta lyhytrunoa (tunnettujen ja tuntemattomien kirjoittajien mukaan)

Sana "runous" tulee latinankielisestä poiesista, joka tarkoittaa "luomisen, tekemisen tai tuottam...

Lue lisää

instagram viewer