סטיית תקן: מה זה ולמה המדד הזה?
המונח סטיית תקן או סטיית תקן מתייחס למדד המשמש לכימות השונות או הפיזור של נתונים מספריים. במשתנה אקראי, אוכלוסייה סטטיסטית, מערך נתונים או התפלגות הסתברות.
עולם המחקר והסטטיסטיקה עשוי להיראות מורכב וזר לכלל האוכלוסייה, כפי שהוא נראה שחישובים מתמטיים מתרחשים מתחת לעינינו מבלי שנוכל להבין את המנגנונים הבסיסיים של ה עצמם. שום דבר אינו רחוק מהמציאות.
בהזדמנות זו אנו הולכים להתייחס בצורה פשוטה אך ממצה להקשר, ה יסוד ויישום של מונח חיוני כמו סטיית התקן בתחום של סטָטִיסטִיקָה.
- מאמר קשור: "פסיכולוגיה וסטטיסטיקה: החשיבות של הסתברויות במדעי ההתנהגות"
מהי סטיית התקן?
סטטיסטיקה היא ענף במתמטיקה שאחראי על רישום השונות, כמו גם על התהליך האקראי שיוצר אותה. לפי חוקי ההסתברות. זה נאמר בקרוב, אבל בתוך התהליכים הסטטיסטיים נמצאות התשובות לכל מה שאנו מחשיבים היום כ"דוגמות" בעולם הטבע והפיסיקה.
לדוגמה, נניח שכאשר זורקים מטבע שלוש פעמים, שניים מהם עולים בראש ובזנב. צירוף מקרים פשוט, נכון? מצד שני, אם נטיל את אותו המטבע 700 פעמים ו-660 מהם נוחתים על ראשים, אולי יתכן שיש גורם שמעדיף את התופעה הזו מעבר אקראיות (תנו לנו לדמיין, למשל, שיש לו זמן לעשות רק מספר מצומצם של סיבובים באוויר, מה שאומר שהוא כמעט תמיד נופל באותו מצב). לפיכך, התבוננות בדפוסים מעבר לצירוף מקרים בלבד מעוררת אותנו לחשוב על הסיבות הבסיסיות למגמה.
מה שאנחנו רוצים להדגים עם הדוגמה המוזרה הזו הוא זה סטטיסטיקה היא כלי חיוני לכל תהליך מדעי., כי על סמך זה אנו מסוגלים להבחין בין מציאויות שהן תוצאה של מקרה לבין אירועים הנשלטים על ידי חוקי טבע.
לפיכך, נוכל לזרוק הגדרה נמהרת של סטיית התקן ולומר שמדובר במדד סטטיסטי שהוא מכפלת השורש הריבועי של השונות שלו. זה כמו להתחיל את הבית מהגג, כי עבור אדם שלא לגמרי מסור לעולם המספרים, ההגדרה הזו ולא יודע כלום על המונח קצת שונה. אז בואו ניקח רגע כדי לנתח את עולם הדפוסים הסטטיסטיים הבסיסיים..
מדדים של מיקום ושונות
מדדי מיקום הם אינדיקטורים המשמשים כדי לציין איזה אחוז מהנתונים בתוך התפלגות תדירות עולה על ביטויים אלה, שהערך שלו מייצג את ערך הנתונים שנמצא במרכז התפלגות התדרים. אל ייאוש, כי אנו מגדירים אותם במהירות:
- ממוצע: הממוצע המספרי של המדגם.
- חציון: מייצג את הערך של משתנה המיקום המרכזי בקבוצה של נתונים מסודרים.
באופן בסיסי, נוכל לומר שמדדי מיקום מתמקדים בחלוקת מערך הנתונים לחלקים שווים באחוזים, כלומר "להגיע לאמצע".
מצד שני, מדדים של שונות אחראים לקבוע את מידת הקרבה או המרחק של ערכי התפלגות בהשוואה למיקומה הממוצע (כלומר, לעומת הממוצע). אלה הם הבאים:
- טווח: מודד את רוחב הנתונים, כלומר מהערך המינימלי למקסימום.
- שונות: התוחלת (ממוצע של סדרת הנתונים) של ריבוע הסטייה של המשתנה האמור ביחס לממוצע שלו.
- סטיית תקן: אינדקס מספרי של פיזור מערך הנתונים.
כמובן, אנו נעים במונחים מורכבים יחסית עבור מי שאינו מסור לחלוטין לעולם המתמטיקה. איננו רוצים להיכנס למדדים אחרים של שונות, שכן בידיעה שככל שהמוצרים המספריים של פרמטרים אלה גדולים יותר, כך מערך הנתונים יהיה פחות הומוגני.
- אולי יעניין אותך: "פסיכומטריה: מהי ולמה היא אחראית?"
"ממוצע של לא טיפוסי"
לאחר שביצענו את הידע של מדדי השונות וחשיבותם בניתוח נתונים, הגיע הזמן למקד את תשומת הלב שלנו לסטיית התקן.
מבלי להיכנס למושגים מורכבים (ואולי לעשות את החטא של פשטות יתר של הדברים), אנו יכולים לומר מדד זה הוא מכפלה של חישוב הממוצע של ערכי "חריגים".. בואו ניתן דוגמה להבהרת הגדרה זו:
יש לנו דגימה של שש כלבות הרות מאותו גזע וגיל שזה עתה הביאו לעולם את המלטות הגורים שלהן בו זמנית. שלושה מהם הביאו לעולם 2 גורים כל אחד, בעוד שלושה נוספים הביאו לעולם 4 גורים לנקבה. באופן טבעי, הערך הממוצע של הצאצאים הוא 3 גורים לנקבה (סכום כל הגורים חלקי המספר הכולל של הנקבות).
מה תהיה סטיית התקן בדוגמה זו? קודם כל, נצטרך להחסיר את הממוצע מהערכים שהושגו ולהעלות את הנתון הזה לריבוע (מכיוון שאנחנו לא רוצים מספרים שליליים), למשל: 4-3=1 או 2-3= (-1, מורם לריבוע, 1) .
השונות תחושב כממוצע הסטיות מהערך הממוצע (במקרה זה, 3). כאן נעמוד בפני השונות, ולכן עלינו לקחת את השורש הריבועי של ערך זה כדי להפוך אותו לאותו סולם מספרי כמו הממוצע. לאחר מכן נקבל את סטיית התקן.
אז מה תהיה סטיית התקן של הדוגמה שלנו? ובכן, גור. ההערכה היא שהממוצע להמלטות הוא שלושה צאצאים, אך נורמלי שהאם תלד גור אחד פחות או אחד יותר בכל המלטה.
אולי דוגמה זו עשויה להישמע מעט מבלבלת בכל הנוגע לשונות וסטייה (מכיוון שהשורש הריבועי של 1 הוא 1), אבל אם השונות הייתה 4, התוצאה של סטיית התקן תהיה 2 (זכור, השורש שלה כיכר).
מה שרצינו להדגים עם הדוגמה הזו הוא זה שונות וסטיית תקן הם מדדים סטטיסטיים המבקשים להשיג את הממוצע של ערכים שאינם הממוצע. זכרו: ככל שסטיית התקן גדולה יותר, כך גדל פיזור האוכלוסייה.
אם נחזור לדוגמא הקודמת, אם כל הכלבות הן מאותו גזע ובעלות משקל דומה, זה נורמלי שהסטייה היא גור אחד לכל המלטה. אבל למשל, אם ניקח עכבר ופיל, ברור שהחריגה מבחינת מספר הצאצאים תגיע לערכים הרבה יותר גדולים מאחד. שוב, ככל שלשתי קבוצות המדגם יש פחות במשותף, כך ניתן לצפות לסטיות גדולות יותר.
למרות זאת, דבר אחד ברור: באמצעות פרמטר זה אנו מחשבים את השונות בנתונים של מדגם, אבל זה לא חייב להיות מייצג של אוכלוסייה שלמה. בדוגמה זו תפסנו שש כלבות, אבל מה אם ניטרנו שבע והשביעית הייתה המלטה של 9 גורים?
כמובן שדפוס הסטייה ישתנה. מסיבה זו, קחו בחשבון גודל המדגם חיוני בעת פירוש כל מערך נתונים. ככל שנאספים יותר מספרים בודדים וככל שניסוי חוזר יותר פעמים, כך אנו מתקרבים להנחת אמת כללית.
מסקנות
כפי שהצלחנו לראות, סטיית התקן היא מדד לפיזור הנתונים. ככל שהפיזור גדול יותר, כך ערך זה יהיה גדול יותר., כי אם היינו עומדים בפני קבוצה של תוצאות הומוגניות לחלוטין (כלומר, שכולן שוות לממוצע), פרמטר זה היה שווה ל-0.
ערך זה הוא בעל חשיבות עצומה בסטטיסטיקה, שכן לא הכל מצטמצם למציאת גשרים משותפים בין דמויות ואירועים, אלא חיוני גם לתעד את השונות בין קבוצות מדגם כדי לשאול את עצמנו יותר שאלות ולקבל יותר ידע בטווח הארוך. טווח.
הפניות ביבליוגרפיות:
- חשב את סטיית התקן צעד אחר צעד, Khanacademy.org. נאסף ב-29 באוגוסט ב https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- Jaime, S., & Vinicio, M. (1973). הסתברות וסטטיסטיקה.
- פארה, ג'יי. M. (1995). סטטיסטיקה תיאורית והסקה I. התאושש מ: http://www. אֲקָדֶמִיָה. edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.
- רנדון-מסיאס, מ. E., Villasis-Keeve, M. Á., & Miranda-Novales, M. ז. (2016). סטטיסטיקה תיאורית. מגזין אלרגיה מקסיקו, 63(4), 397-407.
- ריקרדו, פ. ש. (2011). סטטיסטיקה המיושמת למחקר בריאות. התקבל ממבחן הצ'י-מרובע: http://www. medwave. cl/קישור. cgi/Medwave/Series/MBE04/5266.