मानक विचलन: यह क्या है और यह माप किस लिए है?
शब्द मानक विचलन या मानक विचलन एक माप को संदर्भित करता है जिसका उपयोग संख्यात्मक डेटा की भिन्नता या फैलाव को मापने के लिए किया जाता है। एक यादृच्छिक चर, सांख्यिकीय जनसंख्या, डेटा सेट, या संभाव्यता वितरण में।
अनुसंधान और सांख्यिकी की दुनिया सामान्य आबादी को जटिल और विदेशी लग सकती है, जैसा कि लगता है कि गणितीय गणना हमारी आंखों के नीचे होती है, हम इसके अंतर्निहित तंत्र को समझने में सक्षम नहीं होते हैं खुद। वास्तविकता से आगे कुछ भी नहीं है।
इस अवसर पर हम एक सरल लेकिन संपूर्ण तरीके से संदर्भ को संबंधित करने जा रहे हैं के क्षेत्र में मानक विचलन के रूप में आवश्यक रूप से एक शब्द का आधार और अनुप्रयोग आँकड़े।
- संबंधित लेख: "मनोविज्ञान और सांख्यिकी: व्यवहार के विज्ञान में संभावनाओं का महत्व"
मानक विचलन क्या है?
सांख्यिकी गणित की एक शाखा है जो परिवर्तनशीलता को रिकॉर्ड करने के साथ-साथ इसे उत्पन्न करने वाली यादृच्छिक प्रक्रिया के लिए जिम्मेदार है। संभाव्यता के नियमों का पालन करना. यह जल्द ही कहा जाता है, लेकिन सांख्यिकीय प्रक्रियाओं के भीतर हर चीज का जवाब होता है जिसे आज हम प्रकृति और भौतिकी की दुनिया में "हठधर्मिता" के रूप में मानते हैं।
उदाहरण के लिए, मान लें कि एक सिक्के को तीन बार उछालने पर उनमें से दो सिर और पट ऊपर आते हैं। साधारण संयोग, है ना? दूसरी ओर, यदि हम एक ही सिक्के को 700 बार पलटते हैं और उनमें से 660 सिर पर गिरते हैं, तो शायद यह संभव है कि कोई ऐसा कारक हो जो इस घटना के पक्ष में हो। यादृच्छिकता (उदाहरण के लिए, कल्पना करें कि उसके पास केवल हवा में सीमित संख्या में घुमाव करने का समय है, जिसका अर्थ है कि यह लगभग हमेशा उसी में गिरता है तरीका)। इस प्रकार, महज संयोग से परे पैटर्न देखने से हमें प्रवृत्ति के अंतर्निहित कारणों के बारे में सोचने का संकेत मिलता है।
इस विचित्र उदाहरण से हम जो प्रदर्शित करना चाहते हैं वह यह है सांख्यिकी किसी भी वैज्ञानिक प्रक्रिया के लिए एक आवश्यक उपकरण है।, क्योंकि इसके आधार पर हम उन वास्तविकताओं में अंतर करने में सक्षम होते हैं जो प्राकृतिक नियमों द्वारा नियंत्रित घटनाओं से संयोग का परिणाम हैं।
इस प्रकार, हम मानक विचलन की जल्दबाजी में परिभाषा दे सकते हैं और कह सकते हैं कि यह एक सांख्यिकीय माप है जो इसके प्रसरण के वर्गमूल का गुणनफल है। यह छत से घर शुरू करने जैसा है, क्योंकि एक व्यक्ति जो पूरी तरह से संख्याओं की दुनिया के लिए समर्पित नहीं है, उसके लिए यह परिभाषा और शब्द के बारे में कुछ भी नहीं जानना थोड़ा अलग है। तो आइए कुछ समय के लिए बुनियादी सांख्यिकीय पैटर्न की दुनिया का विश्लेषण करें।.
स्थिति और परिवर्तनशीलता के उपाय
स्थिति माप संकेतक हैं जो यह इंगित करने के लिए उपयोग किए जाते हैं कि आवृत्ति वितरण के भीतर डेटा का कितना प्रतिशत इन अभिव्यक्तियों से अधिक है, जिसका मान उस डेटा के मान का प्रतिनिधित्व करता है जो आवृत्ति वितरण के केंद्र में है. निराश न हों, क्योंकि हम उन्हें शीघ्रता से परिभाषित करते हैं:
- माध्य: नमूने का संख्यात्मक औसत।
- मेडियन: ऑर्डर किए गए डेटा के सेट में केंद्रीय स्थिति चर के मान का प्रतिनिधित्व करता है।
अल्पविकसित तरीके से, हम कह सकते हैं कि स्थिति के उपाय डेटा सेट को समान प्रतिशत भागों में विभाजित करने पर केंद्रित हैं, अर्थात "बीच में जाना"।
दूसरी ओर, परिवर्तनशीलता के उपाय इसके लिए जिम्मेदार हैं अपने औसत स्थान की तुलना में वितरण के मूल्यों की निकटता या दूरी की डिग्री निर्धारित करें (यानी, बनाम माध्य)। ये निम्नलिखित हैं:
- रेंज: डेटा की चौड़ाई को मापता है, यानी न्यूनतम से अधिकतम मान तक।
- विचरण: उक्त चर के माध्य के संबंध में विचलन के वर्ग की अपेक्षा (डेटा श्रृंखला का माध्य)।
- मानक विचलन: डेटा सेट के फैलाव का संख्यात्मक सूचकांक।
बेशक, हम किसी ऐसे व्यक्ति के लिए अपेक्षाकृत जटिल शब्दों में आगे बढ़ रहे हैं जो गणित की दुनिया के लिए पूरी तरह से समर्पित नहीं है। हम परिवर्तनशीलता के अन्य उपायों में नहीं जाना चाहते हैं, क्योंकि यह जानते हुए कि इन मापदंडों के संख्यात्मक उत्पाद जितने अधिक होंगे, डेटा सेट उतना ही कम समरूप होगा।
- आपकी इसमें रुचि हो सकती है: "साइकोमेट्री: यह क्या है और इसके लिए क्या जिम्मेदार है?"
"असामान्य का मतलब"
एक बार जब हमने परिवर्तनशीलता के उपायों और डेटा विश्लेषण में उनके महत्व के ज्ञान को पुख्ता कर लिया है, तो यह मानक विचलन पर अपना ध्यान केंद्रित करने का समय है।
जटिल अवधारणाओं में जाने के बिना (और शायद चीजों को सरल बनाने का पाप करते हुए), हम ऐसा कह सकते हैं यह माप "बाह्य" मानों के माध्य की गणना का गुणनफल है. आइए इस परिभाषा को स्पष्ट करने के लिए एक उदाहरण दें:
हमारे पास एक ही नस्ल और उम्र की छह गर्भवती कुतिया का एक नमूना है जिन्होंने अभी-अभी एक साथ पिल्लों के अपने बच्चों को जन्म दिया है। उनमें से तीन ने 2 पिल्लों को जन्म दिया है, जबकि अन्य तीन ने प्रति मादा 4 पिल्लों को जन्म दिया है। स्वाभाविक रूप से, संतान का औसत मूल्य 3 पिल्ले प्रति महिला है (सभी पिल्लों का योग महिलाओं की कुल संख्या से विभाजित)।
इस उदाहरण में मानक विचलन क्या होगा? सबसे पहले, हमें प्राप्त मूल्यों से माध्य घटाना होगा और इस आंकड़े को वर्ग तक बढ़ाना होगा (चूंकि हम ऋणात्मक संख्या नहीं चाहते हैं), उदाहरण के लिए: 4-3=1 या 2-3= (-1, वर्ग के लिए उठाया, 1)।
विचरण की गणना माध्य मान से विचलन के माध्य के रूप में की जाएगी (इस मामले में, 3)। यहां हम विचरण का सामना कर रहे होंगे, और इसलिए, हमें इस मान का वर्गमूल लेना होगा ताकि इसे उसी संख्यात्मक पैमाने में परिवर्तित किया जा सके जो कि माध्य है। इसके बाद हम मानक विचलन प्राप्त करेंगे।
तो हमारे उदाहरण का मानक विचलन क्या होगा? अच्छा, एक पिल्ला। यह अनुमान लगाया गया है कि कूड़े के लिए औसत तीन संतानें हैं, लेकिन मां के लिए प्रति कूड़े में एक कम या एक अधिक पिल्ले को जन्म देना सामान्य है।
जहाँ तक भिन्नता और विचलन का संबंध है, शायद यह उदाहरण थोड़ा भ्रमित करने वाला लग सकता है (क्योंकि 1 का वर्गमूल है 1), लेकिन यदि प्रसरण 4 था, तो मानक विचलन का परिणाम 2 होगा (याद रखें, इसकी जड़ वर्ग)।
इस उदाहरण से हम जो प्रदर्शित करना चाहते थे वह है विचरण और मानक विचलन सांख्यिकीय उपाय हैं जो माध्य के अलावा अन्य मूल्यों का माध्य प्राप्त करना चाहते हैं. याद रखें: मानक विचलन जितना अधिक होगा, जनसंख्या का फैलाव उतना ही अधिक होगा।
पिछले उदाहरण पर वापस जा रहे हैं, यदि सभी कुतिया एक ही नस्ल के हैं और समान वजन हैं, तो विचलन के लिए प्रति कूड़े में एक पिल्ला होना सामान्य है। लेकिन उदाहरण के लिए, यदि हम एक चूहे और एक हाथी को लेते हैं, तो यह स्पष्ट है कि संतानों की संख्या के मामले में विचलन एक से अधिक मूल्यों तक पहुंच जाएगा। फिर से, दो नमूना समूहों में समानता जितनी कम होगी, उतने ही अधिक विचलन की उम्मीद की जा सकती है।
फिर भी, एक बात स्पष्ट है: इस पैरामीटर का उपयोग करके हम नमूने के डेटा में भिन्नता की गणना कर रहे हैं, लेकिन यह पूरी आबादी का प्रतिनिधि नहीं है। इस उदाहरण में हमने छह कुतिया पकड़ी हैं, लेकिन क्या होगा अगर हम सात पर नजर रखें और सातवें के पास 9 पिल्ले हों?
बेशक, विचलन का पैटर्न बदल जाएगा। इस कारण ध्यान में रखें किसी भी डेटा सेट की व्याख्या करते समय नमूना आकार आवश्यक है. जितनी अधिक व्यक्तिगत संख्याएँ एकत्र की जाती हैं और जितनी बार एक प्रयोग दोहराया जाता है, हम एक सामान्य सत्य को मानने के करीब आते हैं।
निष्कर्ष
जैसा कि हम देख पाए हैं, मानक विचलन डेटा फैलाव का एक उपाय है। फैलाव जितना अधिक होगा, यह मान उतना ही अधिक होगा।, क्योंकि अगर हम पूरी तरह से सजातीय परिणामों के एक सेट के साथ सामना कर रहे थे (अर्थात, कि वे सभी माध्य के बराबर थे), यह पैरामीटर 0 के बराबर होगा।
आँकड़ों में इस मूल्य का अत्यधिक महत्व है, क्योंकि आंकड़ों और घटनाओं के बीच सामान्य पुलों को खोजने के लिए सब कुछ कम नहीं किया जाता है, बल्कि खुद से अधिक प्रश्न पूछने और लंबे समय में अधिक ज्ञान प्राप्त करने के लिए नमूना समूहों के बीच परिवर्तनशीलता को रिकॉर्ड करना भी आवश्यक है। अवधि।
ग्रंथ सूची संदर्भ:
- स्टेप बाई स्टेप मानक विचलन की गणना करें, khanacademy.org। 29 अगस्त को एकत्र किया गया https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- जेमे, एस., और विनिसियो, एम. (1973). प्रायिकता अौर सांख्यिकी।
- पारा, जे. एम। (1995). वर्णनात्मक और अनुमानित आँकड़े I. से बरामद: http://www. अकादमी। edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. पीडीएफ।
- रेंडन-मैकियास, एम। ई।, विलासिस-कीव, एम। ए।, और मिरांडा-नोवेल्स, एम। जी। (2016). वर्णनात्मक आँकड़े। एलर्जी पत्रिका मेक्सिको, 63(4), 397-407।
- रिकार्डो, एफ. क्यू। (2011). सांख्यिकी स्वास्थ्य अनुसंधान के लिए लागू। ची-स्क्वायर परीक्षण से प्राप्त: http://www. medwave. सीएल/लिंक। सीजीआई/मेडवेव/सीरीज/एमबीई04/5266.