Standart sapma: nedir ve bu ölçü ne için?
Standart sapma veya standart sapma terimi, sayısal verilerin varyasyonunu veya dağılımını ölçmek için kullanılan bir ölçüyü ifade eder. rastgele bir değişkende, istatistiksel popülasyonda, veri setinde veya olasılık dağılımında.
Araştırma ve istatistik dünyası, göründüğü gibi, genel nüfusa karmaşık ve yabancı görünebilir. Matematiksel hesaplamaların, altında yatan mekanizmaları anlayamadan gözümüzün önünde gerçekleştiğini. kendileri. Hiçbir şey gerçeklikten daha uzak değildir.
Bu vesileyle, bağlamı basit ama ayrıntılı bir şekilde anlatacağız. alanında standart sapma kadar önemli bir terimin kurulması ve uygulanması İstatistik.
- İlgili makale: "Psikoloji ve İstatistik: Davranış Biliminde Olasılıkların Önemi"
standart sapma nedir?
İstatistik, değişkenliği ve onu oluşturan rastgele işlemi kaydetmekten sorumlu olan bir matematik dalıdır. olasılık yasalarını takip etmek. Bu yakında söylenir, ancak istatistiksel süreçler içinde, bugün doğa ve fizik dünyasında "dogmalar" olarak kabul ettiğimiz her şeyin yanıtları vardır.
Örneğin, üç kez yazı tura atıldığında iki tanesinin tura ve yazı geldiğini varsayalım. Basit tesadüf, değil mi? Öte yandan, aynı madeni parayı 700 kez atarsak ve 660'ı tura gelirse, belki de bu fenomeni destekleyen bir faktör olabilir. rastgelelik (örneğin, havada yalnızca sınırlı sayıda dönüş yapmak için zamanı olduğunu, yani neredeyse her zaman aynı yöne düştüğünü varsayalım. modu). Bu nedenle, kalıpları tesadüflerin ötesinde gözlemlemek, bizi eğilimin altında yatan nedenler hakkında düşünmeye sevk eder.
Bu tuhaf örnekle göstermek istediğimiz şey, İstatistik, herhangi bir bilimsel süreç için gerekli bir araçtır., çünkü ona dayanarak, tesadüflerin sonucu olan gerçekleri, doğa kanunlarının yönettiği olaylardan ayırt edebiliyoruz.
Böylece, standart sapmanın acele bir tanımını atabilir ve varyansının karekökünün ürünü olan istatistiksel bir ölçü olduğunu söyleyebiliriz. Bu, evi çatıdan başlatmak gibidir, çünkü kendini tamamen sayılar dünyasına adamamış bir kişi için bu tanım ve terim hakkında hiçbir şey bilmemek biraz farklıdır. Öyleyse, temel istatistiksel kalıpların dünyasını incelemek için biraz zaman ayıralım..
Konum ve değişkenlik ölçüleri
Konum ölçüleri, bir sıklık dağılımı içindeki verilerin yüzde kaçının bu ifadeleri aştığını belirtmek için kullanılan göstergelerdir. Değeri, frekans dağılımının merkezindeki verinin değerini temsil eden. Umutsuzluğa kapılmayın, çünkü bunları hızlı bir şekilde tanımlıyoruz:
- Ortalama: Örneğin sayısal ortalaması.
- Medyan: sıralı bir veri kümesindeki merkezi konum değişkeninin değerini temsil eder.
Basit bir ifadeyle, konum ölçümlerinin veri setini eşit yüzdelere bölmeye, yani “ortaya çıkmaya” odaklandığını söyleyebiliriz.
Öte yandan, değişkenlik ölçüleri sorumludur bir dağılımın değerlerinin ortalama konumuna göre yakınlık veya uzaklık derecesini belirlemek (yani, ortalamaya karşı). Bunlar aşağıdaki gibidir:
- Aralık: Verinin genişliğini, yani minimum değerden maksimum değere kadar ölçer.
- Varyans: söz konusu değişkenin ortalamasına göre sapmasının karesinin beklentisi (veri serisinin ortalaması).
- Standart sapma: veri setinin dağılımının sayısal indeksi.
Elbette kendini tamamen matematik dünyasına adamamış biri için nispeten karmaşık terimlerle hareket ediyoruz. Diğer değişkenlik ölçülerine girmek istemiyoruz, çünkü bu parametrelerin sayısal çarpımları ne kadar büyük olursa, veri setinin o kadar az homojen olacağını biliyoruz.
- İlginizi çekebilir: "Psikometri: nedir ve neden sorumludur?"
“Atipik Ortalama”
Değişkenlik ölçüleri ve bunların veri analizindeki önemi hakkındaki bilgimizi pekiştirdikten sonra, dikkatimizi standart sapmaya yeniden odaklamanın zamanı geldi.
Karmaşık kavramlara girmeden (ve belki de şeyleri aşırı basitleştirme günahını işlemeden), şunu söyleyebiliriz: bu ölçü, "aykırı" değerlerin ortalamasını hesaplamanın ürünüdür. Bu tanımı netleştirmek için bir örnek verelim:
Aynı anda yavrularını yeni doğurmuş aynı cins ve yaştaki altı hamile sürtükten oluşan bir örneğimiz var. Üçü 2'şer yavru doğururken, 3'ü dişi başına 4'er yavru doğurdu. Doğal olarak, yavruların ortalama değeri dişi başına 3 yavrudur (tüm yavruların toplamı bölü toplam dişi sayısı).
Bu örnekte standart sapma ne olurdu? Öncelikle elde edilen değerlerden ortalamayı çıkarmamız ve bu rakamı kareye yükseltmemiz gerekir (negatif sayılar istemediğimiz için), örneğin: 4-3=1 veya 2-3= (-1), kareye yükseltilmiş, 1) .
Varyans, ortalama değerden sapmaların ortalaması olarak hesaplanacaktır. (bu durumda, 3). Burada varyansla karşı karşıya kalacağız ve bu nedenle, ortalama ile aynı sayısal ölçeğe dönüştürmek için bu değerin karekökünü almamız gerekiyor. Bundan sonra standart sapmayı elde ederiz.
Peki örneğimizin standart sapması ne olurdu? Bir köpek yavrusu. Doğumların ortalamasının üç yavru olduğu tahmin edilmektedir, ancak annenin doğum başına bir eksik veya bir fazla yavru doğurması normaldir.
Belki de bu örnek, varyans ve sapma söz konusu olduğunda biraz kafa karıştırıcı gelebilir (çünkü 1'in karekökü 1), ancak varyans 4 olsaydı, standart sapmanın sonucu 2 olurdu (hatırlayın, kökü kare).
Bu örnekle göstermek istediğimiz şey, varyans ve standart sapma, ortalama dışındaki değerlerin ortalamasını elde etmeye çalışan istatistiksel önlemlerdir.. Unutmayın: standart sapma ne kadar büyükse popülasyonun dağılımı da o kadar büyük olur.
Bir önceki örneğe dönecek olursak, eğer tüm dişi köpekler aynı cinsten ve benzer ağırlıklara sahipse, sapmanın doğum başına bir yavru olması normaldir. Ancak örneğin bir fare ve bir fil alırsak, yavru sayısı açısından sapmanın birden çok daha büyük değerlere ulaşacağı açıktır. Yine, iki örnek grubun ortak noktası ne kadar azsa, sapmaların o kadar büyük olması beklenebilir.
Yine de bir şey açık: Bu parametreyi kullanarak bir örneklemin verilerindeki varyansı hesaplıyoruz, ancak bunun tüm popülasyonu temsil etmesi gerekmiyor. Bu örnekte altı dişi köpek yakaladık, ama ya yedisini izlersek ve yedincinin çöpünde 9 köpek yavrusu olursa?
Tabii ki, sapma modeli değişecektir. Bu sebeple dikkate herhangi bir veri setini yorumlarken örneklem büyüklüğü önemlidir. Ne kadar çok bireysel sayı toplanırsa ve bir deney ne kadar çok tekrarlanırsa, genel bir doğruyu varsaymaya o kadar yaklaşırız.
sonuçlar
Gözlemleyebildiğimiz gibi, standart sapma veri dağılımının bir ölçüsüdür. Dağılım ne kadar büyük olursa, bu değer o kadar büyük olacaktır., çünkü bir dizi tamamen homojen sonuçla karşı karşıya kalsaydık (yani, hepsinin ortalamaya eşit olması), bu parametre 0'a eşit olurdu.
Bu değer, istatistikte çok büyük bir öneme sahiptir, çünkü her şey rakamlar ve olaylar arasında ortak köprüler bulmaya indirgenmemiştir. kendimize daha fazla soru sormak ve uzun vadede daha fazla bilgi edinmek için örneklem grupları arasındaki değişkenliği kaydetmek de önemlidir. terim.
Bibliyografik referanslar:
- Standart sapmayı adım adım hesaplayın, khanacademy.org. 29 Ağustos'ta toplandı https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- Jaime, S. ve Vinicio, M. (1973). Olasılık ve istatistik.
- Parra, J. M. (1995). Tanımlayıcı ve çıkarımsal istatistikler I. Kimden kurtarıldı: http://www. akademi edu/indir/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.
- Rendon-Macías, M. E., Villasis-Keeve, M. Á., & Miranda-Novales, M. G. (2016). Tanımlayıcı istatistikler. Allergy Magazine Mexico, 63(4), 397-407.
- Ricardo, F. Q. (2011). Sağlık araştırmalarına uygulanan istatistikler. Ki-Kare testinden elde edilen: http://www. orta dalga cl/bağlantı. cgi/Medwave/Serisi/MBE04/5266.