जिपफ का नियम: एक जिज्ञासु सामाजिक और गणितीय घटना
हम हर दिन हजारों शब्दों का प्रयोग करते हैं, सभी प्रकार के अर्थों के साथ और बहुत विविध व्याकरणिक श्रेणियों से संबंधित हैं। हालांकि, उन सभी का उपयोग समान आवृत्ति के साथ नहीं किया जाता है। वाक्य की संरचना के लिए वे कितने महत्वपूर्ण हैं, इस पर निर्भर करते हुए, ऐसे शब्द हैं जो दूसरों की तुलना में अधिक आवर्तक हैं।
Zipf का नियम एक अभिधारणा है जो इस परिघटना को ध्यान में रखता है और निर्दिष्ट करता है कि किसी भाषा में प्रयुक्त सभी शब्दों की रैंकिंग में उसकी स्थिति के आधार पर किसी शब्द के उपयोग की कितनी संभावना है। आगे हम इस कानून के बारे में और विस्तार से जानेंगे।
- संबंधित लेख: "भाषा के 12 प्रकार (और उनकी विशेषताएं)"
जिपफ का नियम
जॉर्ज किंग्सले जिपफ (1902-1950) एक अमेरिकी भाषाविद् थे, जिनका जन्म फ्रीपोर्ट, इलिनोइस में हुआ था, जिन्होंने तुलनात्मक भाषाशास्त्र के अपने अध्ययन में एक जिज्ञासु घटना का सामना किया। अपने काम में, जिसमें वे सांख्यिकीय विश्लेषण कर रहे थे, उन्होंने पाया कि सबसे अधिक इस्तेमाल किए जाने वाले शब्दों में दिखने का एक पैटर्न होता है, यह उस कानून का जन्म है जो उसका उपनाम प्राप्त करता है।
जिपफ के नियम के अनुसार, अधिकांश समय में, यदि हमेशा नहीं तो,
लिखित पाठ या मौखिक बातचीत में उपयोग किए जाने वाले शब्द निम्नलिखित पैटर्न का पालन करेंगे:: सबसे अधिक इस्तेमाल किया जाने वाला शब्द, जो रैंकिंग में पहले स्थान पर होगा, दो बार अक्सर इस्तेमाल किया जाएगा दूसरा सबसे अधिक इस्तेमाल किया जाने वाला, तीसरे से तीन गुना अधिक, चौथे से चार गुना अधिक, और इसी तरह क्रमिक रूप से।गणितीय शब्दों में, यह कानून होगा:
पं 1⁄na
जहाँ 'Pn' क्रम 'n' में किसी शब्द की बारंबारता है और घातांक 'a' लगभग 1 है।
यह कहा जाना चाहिए कि जॉर्ज जिपफ अकेले नहीं थे जिन्होंने सबसे अधिक इस्तेमाल किए जाने वाले शब्दों की आवृत्ति में इस नियमितता को देखा कई भाषाओं में, प्राकृतिक और कृत्रिम दोनों। वास्तव में, यह ज्ञात है कि स्टेग्नोग्राफर जीन-बैप्टिस्ट एस्टौप और भौतिक विज्ञानी फेलिक्स ऑरबैक जैसे अन्य लोग भी थे।
जिपफ ने इस घटना का अध्ययन अंग्रेजी में ग्रंथों के साथ किया और जाहिर है, यह सच है। अगर हम. का मूल संस्करण लेते हैं चार्ल्स डार्विन द्वारा प्रजातियों की उत्पत्ति (१८५९) हम देखते हैं कि पहले अध्याय में सबसे अधिक इस्तेमाल किया जाने वाला शब्द "द" है, जिसमें लगभग. का आभास होता है 1,050, जबकि दूसरा "और" है, लगभग 400 बार दिखाई दे रहा है, और तीसरा "से," दिखाई दे रहा है लगभग 300. हालांकि बिल्कुल नहीं, आप देख सकते हैं कि दूसरा शब्द पहले की तुलना में आधा और तीसरा एक तिहाई दिखाई देता है।
स्पेनिश में ऐसा ही होता है. यदि हम इसी लेख को एक उदाहरण के रूप में लेते हैं, तो हम देख सकते हैं कि "के" शब्द का प्रयोग 85 बार किया जाता है, क्योंकि सबसे अधिक उपयोग किया जाता है, जबकि "ला" शब्द, जो दूसरा सबसे अधिक उपयोग किया जाता है, की गणना 57. तक की जा सकती है बार।
यह देखते हुए कि यह घटना अन्य भाषाओं में होती है, यह सोचना दिलचस्प हो जाता है कि मानव मस्तिष्क भाषा को कैसे संसाधित करता है। यद्यपि कई सांस्कृतिक घटनाएं हैं जो कई शब्दों के उपयोग और अर्थ को मापती हैं, प्रश्न में भाषा एक है अपने आप में सांस्कृतिक कारक, जिस तरह से हम सबसे अधिक इस्तेमाल किए जाने वाले शब्दों का उपयोग करते हैं, वह एक स्वतंत्र कारक लगता है संस्कृति।
- आपकी रुचि हो सकती है: "सांस्कृतिक मनोविज्ञान क्या है?"
फ़ंक्शन शब्दों की आवृत्ति
आइए निम्नलिखित दस शब्दों को देखें: 'क्या', 'से', 'नहीं', 'से', 'द', 'द', 'है', 'और', 'इन' और 'व्हाट'। उन सब के बीच एक जैसी बात क्या है? जो अपने आप में अर्थहीन शब्द हैं लेकिन विडंबना है स्पेनिश भाषा में 10 सबसे अधिक इस्तेमाल किए जाने वाले शब्द हैं.
यह कहने से कि उनमें अर्थ का अभाव है, हमारा तात्पर्य यह है कि यदि कोई ऐसा वाक्य कहा जाए जिसमें संज्ञा, विशेषण, क्रिया या क्रिया विशेषण न हो तो वह वाक्य अर्थहीन हो जाता है। उदाहरण के लिए:
… और …… में …… एक……… से………
दूसरी ओर, यदि हम बिंदुओं को शब्दों के साथ अर्थ के साथ बदलते हैं, तो हमारे पास निम्न जैसा वाक्यांश हो सकता है।
मिगुएल और एना के घर में उनके बिस्तर के बगल में एक भूरी मेज है।
ये अक्सर उपयोग किए जाने वाले शब्द हैं जो ज्ञात कार्य शब्द हैं, और वे वाक्य को व्याकरणिक संरचना देने के प्रभारी हैं. वे केवल 10 ही नहीं हैं जिन्हें हमने देखा है, वास्तव में उनमें से दर्जनों हैं, और ये सभी स्पेनिश में सौ सबसे अधिक इस्तेमाल किए जाने वाले शब्दों में से हैं।
हालांकि वे अपने आप में अर्थहीन हैं, किसी भी वाक्य में जिसे आप समझना चाहते हैं, छोड़ना असंभव है. यह आवश्यक है कि मनुष्य, एक संदेश को कुशलतापूर्वक प्रसारित करने के लिए, हम उन शब्दों का सहारा लेते हैं जो वाक्य की संरचना का निर्माण करते हैं। इस कारण से, वे उत्सुकता से, सबसे अधिक उपयोग किए जाते हैं।
जाँच पड़ताल
जॉर्ज जिपफ ने तुलनात्मक दर्शन के अपने अध्ययन में जो देखा उसके बावजूद, अपेक्षाकृत हाल ही में जब तक कानून के अभिधारणाओं को अनुभवजन्य रूप से संबोधित करना संभव नहीं था. इसलिए नहीं कि अंग्रेजी, या किसी अन्य भाषा में सभी वार्तालापों या ग्रंथों का विश्लेषण करना भौतिक रूप से असंभव था, बल्कि कठिन कार्य और इसमें शामिल महान प्रयास के कारण।
सौभाग्य से, और आधुनिक कंप्यूटिंग और सॉफ्टवेयर के अस्तित्व के लिए धन्यवाद, यह रहा है यह जांचना संभव है कि क्या यह कानून उस तरह से दिया गया था जिस तरह से जिपफ ने शुरुआत में इसे प्रस्तावित किया था या यदि थे विविधताएं।
एक मामला बार्सिलोना के स्वायत्त विश्वविद्यालय से जुड़े सेंटर फॉर मैथमैटिकल रिसर्च (सीआरएम, कैटलन सेंटर डी रेसेर्का मैटेमेटिका में) द्वारा किया गया शोध है। शोधकर्ता अलवारो कोरल, इसाबेल मोरेनो गार्सिया और फ्रांसेस्क फॉन्ट क्लॉस ने एक व्यापक विश्लेषण किया जिस पैमाने पर उन्होंने अंग्रेजी में हजारों डिजीटल ग्रंथों का विश्लेषण किया, यह देखने के लिए कि जिपफ का कानून कितना सही था।
उनके काम, जिसमें लगभग ३०,००० खंडों के व्यापक संग्रह का विश्लेषण किया गया था, ने उन्हें जिपफ के बराबर एक कानून प्राप्त करने की अनुमति दी।, जिसमें यह देखा गया कि सबसे अधिक इस्तेमाल किया जाने वाला शब्द दूसरे के रूप में दो बार इस्तेमाल किया गया था, और इसी तरह।
अन्य संदर्भों में जिपफ कानून
हालांकि जिपफ का नियम मूल रूप से प्रत्येक भाषा में प्रयुक्त शब्दों की आवृत्ति को समझाने के लिए इस्तेमाल किया गया था, ग्रंथों और वार्तालापों में इसकी वास्तविक आवृत्ति के साथ इसकी उपस्थिति की सीमा की तुलना करते हुए, इसे अन्य के लिए भी एक्सट्रपलेशन किया गया है स्थितियां।
बल्कि चौंकाने वाला मामला है अमेरिकी राजधानियों में रहने वाले लोगों की संख्या. जिपफ के नियम के अनुसार, अमेरिका की सबसे अधिक आबादी वाली राजधानी का आकार दूसरी सबसे अधिक आबादी वाले आकार से दोगुना और तीसरी सबसे अधिक आबादी वाले आकार का तीन गुना था।
यदि आप 2010 की जनगणना को देखें, तो यह सहमत है। न्यूयॉर्क की कुल जनसंख्या ८,१७५,१३३ थी, जिसके बाद सबसे अधिक जनसंख्या वाली राजधानी लॉस एंजिल्स थी 3,792,621 और रैंकिंग में निम्नलिखित राजधानियाँ, शिकागो, ह्यूस्टन और फिलाडेल्फिया 2,695,598, 2,100,263 और 1,526,006 के साथ, क्रमश:
यह स्पेन में सबसे अधिक आबादी वाले शहरों के मामले में भी देखा जा सकता है, हालांकि ज़िपफ का कानून लागू नहीं होता है। यह पूरी तरह से आज्ञाकारी है, लेकिन यह अधिक या कम हद तक, प्रत्येक शहर के रैंक के अनुरूप है each रैंकिंग। मैड्रिड, 3,266,126 की आबादी के साथ, बार्सिलोना की तुलना में दोगुना है, 1,636,762 के साथ, जबकि वालेंसिया में 800,000 निवासियों के साथ लगभग एक तिहाई है।
जिपफ के नियम का एक और देखने योग्य मामला वेब पेजों के साथ है. साइबरस्पेस बहुत व्यापक है, जिसमें लगभग 15 बिलियन वेब पेज बनाए गए हैं। इस बात को ध्यान में रखते हुए कि दुनिया में लगभग 6,800 मिलियन लोग हैं, सैद्धांतिक रूप से उनमें से प्रत्येक के लिए प्रतिदिन दो वेब पेज देखने होंगे, जो कि ऐसा नहीं है।
वर्तमान में सबसे अधिक देखे जाने वाले दस पृष्ठ हैं: Google (60.49 मिलियन मासिक विज़िट), Youtube (24.31 मिलियन), Facebook (19.98 मिलियन), Baidu (9.77 मिलियन), विकिपीडिया (4.69 मिलियन), ट्विटर (3.92 मिलियन), याहू (3.74 मिलियन), पोर्नहब (3.36 मिलियन), इंस्टाग्राम (3.21 मिलियन) और Xvideos (3, 19) लाखों)। इन नंबरों को देखते हुए, आप देख सकते हैं कि Google YouTube से दोगुना, फेसबुक से तीन गुना, Baidu से चार गुना अधिक है ...
ग्रंथ सूची संदर्भ:
- फॉन्ट-क्लोस, एफ., बोलेदा, जी. और कोरल,. (२०१३) ज़िपफ के कानून से परे एक स्केलिंग कानून और हीप्स कानून से इसका संबंध। न्यू जर्नल ऑफ फिजिक्स, 15. doi.org/10.1088/1367-2630/15/9/093033।
- मोंटेमुरो, एम। सेवा मेरे। (2001). जिपफ से परे - मात्रात्मक भाषाविज्ञान में मंडेलब्रॉट कानून। फिजिका ए: सांख्यिकीय यांत्रिकी और इसके अनुप्रयोग 300: 567-578।