Стандартне відхилення: що це таке і для чого цей показник?
Термін стандартне відхилення або стандартне відхилення відноситься до міри, яка використовується для кількісної оцінки варіації або дисперсії числових даних. у випадковій змінній, статистичній сукупності, наборі даних або розподілі ймовірностей.
Світ досліджень і статистики може здатися складним і чужим для населення, як здається що математичні розрахунки відбуваються на наших очах, але ми не можемо зрозуміти основні механізми себе. Немає нічого далі від реальності.
Цього разу ми просто, але вичерпно пояснимо контекст, заснування та застосування такого важливого терміну, як стандартне відхилення в області статистика.
- Пов'язана стаття: «Психологія та статистика: важливість ймовірностей у науці про поведінку»
Що таке стандартне відхилення?
Статистика — це розділ математики, який відповідає за реєстрацію мінливості, а також випадкового процесу, який її породжує. дотримуючись законів ймовірності. Це сказано незабаром, але в статистичних процесах є відповіді на все, що ми сьогодні вважаємо «догмами» у світі природи та фізики.
Наприклад, скажімо, що підкинувши монету три рази, дві з них випадають орлом і решкою. Простий збіг, правда? З іншого боку, якщо ми підкидаємо одну і ту ж монету 700 разів і 660 з них потрапляють на голови, можливо, існує фактор, який сприяє цьому явищу, крім випадковість (уявімо, наприклад, що він встигає зробити лише обмежену кількість поворотів у повітрі, а це означає, що він майже завжди падає в те саме режим). Таким чином, спостереження закономірностей, що виходять за межі простого збігу, спонукає нас задуматися про глибинні причини цієї тенденції.
Ось що ми хочемо продемонструвати цим дивним прикладом Статистика є важливим інструментом будь-якого наукового процесу., оскільки на його основі ми можемо відрізнити реальність, яка є результатом випадковості, від подій, керованих природними законами.
Таким чином, ми можемо дати поспішне визначення стандартного відхилення і сказати, що це статистичний показник, який є добутком квадратного кореня його дисперсії. Це все одно, що починати будинок з даху, тому що для людини, яка не повністю присвячена світу чисел, це визначення і нічого не знають про цей термін мало відрізняються. Тож давайте на хвилинку розберемо світ основних статистичних закономірностей..
Міри положення та мінливості
Міри позиції – це індикатори, які використовуються для вказівки того, який відсоток даних у частотному розподілі перевищує ці вирази, значення якого представляє значення даних, які знаходяться в центрі частотного розподілу. Не впадайте у відчай, адже ми їх швидко визначаємо:
- Середнє: середнє числове значення вибірки.
- Медіана: представляє значення змінної центральної позиції в наборі впорядкованих даних.
У елементарному вигляді можна сказати, що показники позиції зосереджені на розподілі набору даних на рівні відсоткові частини, тобто «дістатися до середини».
З іншого боку, міри мінливості відповідають за визначити ступінь близькості або відстані значень розподілу порівняно з його середнім розташуванням (тобто проти середнього). Це такі:
- Діапазон: вимірює ширину даних, тобто від мінімального до максимального значення.
- Дисперсія: сподівання (середнє значення ряду даних) квадрата відхилення зазначеної змінної відносно її середнього значення.
- Стандартне відхилення: числовий показник дисперсії набору даних.
Звичайно, ми рухаємося у відносно складних термінах для тих, хто не повністю присвячений світу математики. Ми не хочемо вдаватися до інших мір мінливості, оскільки знаємо, що чим більші числові продукти цих параметрів, тим менш гомогенізованим буде набір даних.
- Вас може зацікавити: «Психометрія: що це таке і за що вона відповідає?»
«Значення нетипового»
Після того, як ми закріпили знання про показники мінливості та їх важливість для аналізу даних, настав час знову зосередити нашу увагу на стандартному відхиленні.
Не вдаючись у складні концепції (і, можливо, грішачи надмірним спрощенням), ми можемо сказати, що цей показник є продуктом обчислення середнього значення «викидних» значень. Наведемо приклад, щоб уточнити це визначення:
У нас є зразок із шести вагітних сук однієї породи та віку, які щойно народили своїх цуценят одночасно. Троє з них народили по 2 цуценята, ще троє народили по 4 цуценята на самку. Природно, середнє значення потомства становить 3 дитинчати на самку (сума всіх дитинчат, поділена на загальну кількість самок).
Яким буде стандартне відхилення в цьому прикладі? Перш за все, ми повинні відняти середнє значення з отриманих значень і підняти цю цифру до квадрата (оскільки ми не хочемо мати від’ємні числа), наприклад: 4-3=1 або 2-3= (-1, піднесений до квадрата, 1) .
Дисперсію буде розраховано як середнє значення відхилень від середнього значення (в даному випадку 3). Тут ми зіткнемося з дисперсією, а отже, ми маємо взяти квадратний корінь із цього значення, щоб перетворити його в ту саму числову шкалу, що й середнє. Після цього ми отримаємо стандартне відхилення.
Отже, яким буде стандартне відхилення нашого прикладу? Ну, цуценя. Підраховано, що в середньому для посліду є три потомства, але це нормально, коли мати народжує на одного менше або на одного дитинчати більше за послід.
Можливо, цей приклад може здатися трохи заплутаним, що стосується дисперсії та відхилення (оскільки квадратний корінь з 1 є 1), але якби дисперсія дорівнювала 4, результат стандартного відхилення був би 2 (пам’ятайте, його корінь Майдан).
Ось що ми хотіли продемонструвати цим прикладом дисперсія та стандартне відхилення є статистичними показниками, які прагнуть отримати середнє значення інших значень, ніж середнє. Пам’ятайте: чим більше стандартне відхилення, тим більше розкид генеральної сукупності.
Повертаючись до попереднього прикладу, якщо всі суки однієї породи та мають однакову вагу, нормально, щоб відхилення становило одне цуценя на послід. Але, наприклад, якщо ми візьмемо мишу і слона, то зрозуміло, що відхилення за кількістю потомства досягне значень, набагато більших за одиницю. Знову ж таки, чим менше спільного між двома групами вибірки, тим більших відхилень можна очікувати.
Незважаючи на це, зрозуміло одне: за допомогою цього параметра ми обчислюємо дисперсію даних вибірки, але вона не обов’язково має бути репрезентативною для всієї сукупності. У цьому прикладі ми зловили шість сук, але що, якби ми спостерігали за сімома, а сьома мала послід із 9 цуценят?
Звичайно, схема відхилення зміниться. З цієї причини враховуйте розмір вибірки має важливе значення при інтерпретації будь-якого набору даних. Чим більше окремих чисел зібрано і чим більше разів повторюється експеримент, тим ближче ми підходимо до постулювання загальної істини.
висновки
Як ми могли спостерігати, стандартне відхилення є мірою розсіювання даних. Чим більше дисперсія, тим більше буде це значення., оскільки якби ми зіткнулися з набором абсолютно однорідних результатів (тобто, щоб усі вони були рівними середньому), цей параметр дорівнював би 0.
Ця величина має величезне значення в статистиці, оскільки не все зводиться до пошуку спільних містків між цифрами і подіями, а також важливо зафіксувати мінливість між групами вибірки, щоб ставити собі більше запитань і отримати більше знань у довгостроковій перспективі. термін.
Бібліографічні посилання:
- Розрахуйте стандартне відхилення крок за кроком, khanacademy.org. Зібрано 29 серпня в с https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- Хайме С. і Вінісіо М. (1973). Імовірність і статистика.
- Парра, Дж. м. (1995). Описова та логічна статистика І. Відновлено з: http://www. академії. edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.
- Рендон-Масіас, М. Е., Вілласіс-Ків, М. А. та Міранда-Новалес М. g. (2016). Описова статистика. Алергічний журнал Мексика, 63 (4), 397-407.
- Рікардо, Ф. Q. (2011). Статистика, застосована до досліджень здоров'я. Отримано за допомогою тесту хі-квадрат: http://www. medwave. cl/посилання. cgi/Medwave/Series/MBE04/5266.