ზიპფის კანონი: საინტერესო სოციალური და მათემატიკური ფენომენი
ჩვენ ყოველდღე ვიყენებთ ათასობით სიტყვას, ყველანაირი მნიშვნელობით და ძალიან მრავალფეროვან გრამატიკულ კატეგორიებს განეკუთვნება. ამასთან, ყველა ერთი და იგივე სიხშირით არ გამოიყენება. იმისდა მიხედვით, თუ რამდენად მნიშვნელოვანია ისინი წინადადების სტრუქტურისთვის, არსებობს სიტყვები, რომლებიც სხვებზე უფრო განმეორებადია.
ზიპფის კანონი არის პოსტულატი, რომელიც ითვალისწინებს ამ ფენომენს და განსაზღვრავს, თუ რამდენად არის შესაძლებელი სიტყვის გამოყენება ენაში გამოყენებული ყველა სიტყვის რეიტინგში მისი პოზიციის საფუძველზე. შემდეგ უფრო დეტალურად განვიხილავთ ამ კანონის შესახებ.
- დაკავშირებული სტატია: "ენის 12 ტიპი (და მათი მახასიათებლები)"
ზიპფის კანონი
ჯორჯ კინგსლი ზიფფი (1902–1950) იყო ამერიკელი ენათმეცნიერი, დაიბადა ილინოისის შტატ ფრიპორტში, რომელსაც შედარებითი ფილოლოგიის შესწავლის დროს უცნაური ფენომენი შეხვდა. თავის ნაშრომში, რომელშიც ის სტატისტიკურ ანალიზს ატარებდა, მან აღმოაჩინა, რომ როგორც ჩანს, ყველაზე ხშირად გამოყენებულ სიტყვებს ჰქონდა გარეგნობის ნიმუშიეს არის კანონის დაბადება, რომელიც იღებს მის გვარს.
ზიპფის კანონის თანახმად, დროის დიდ უმრავლესობაში, თუ არა ყოველთვის, სიტყვები, რომლებიც გამოიყენება წერილობით ტექსტში ან ზეპირ საუბარში, შემდეგ მაგალითს მიიღებს: ყველაზე ხშირად გამოყენებული სიტყვა, რომელიც პირველ ადგილს დაიკავებს რეიტინგში, ორჯერ უფრო ხშირად გამოიყენებოდა, ვიდრე მეორე ყველაზე მეტად გამოყენებული, სამჯერ სამჯერ, ვიდრე მეოთხე, ოთხჯერ მეოთხეზე და ა.შ. თანმიმდევრულად.
მათემატიკური თვალსაზრისით, ეს კანონი იქნება:
Pn 1⁄na
სადაც 'Pn' არის სიტყვის სიხშირე 'n' თანმიმდევრობით, ხოლო 'a' გამოხატული არის დაახლოებით 1.
უნდა ითქვას რომ ჯორჯ ზიფფი არ იყო ერთადერთი, ვინც აკვირდებოდა ამ კანონზომიერებას ყველაზე ხშირად გამოყენებული სიტყვების სიხშირეში მრავალი ენის, როგორც ბუნებრივი, ასევე ხელოვნური. სინამდვილეში, ცნობილია, რომ იყვნენ სხვებიც, მაგალითად სტეგანოგრაფი ჟან ბატისტ ესტუპი და ფიზიკოსი ფელიქს აუერბახი.
ზიპფმა შეისწავლა ეს ფენომენი ინგლისურენოვანი ტექსტებით და, როგორც ჩანს, მართალია. თუ ავიღებთ ორიგინალ ვერსიას სახეობების წარმოშობა ჩარლზ დარვინი (1859) ჩვენ ვხედავთ, რომ პირველ თავში ყველაზე ხშირად გამოყენებული სიტყვაა "the", რომლის შესახედაობა დაახლოებით 1,050, ხოლო მეორე "და", დაახლოებით 400-ჯერ ჩანს და მესამე "to" გამოჩნდება დაახლოებით 300. მართალია არა, მაგრამ ხედავთ, რომ მეორე სიტყვა ნაჩვენებია ნახევარზე იმდენჯერ, ვიდრე პირველი და მესამე ერთი მესამედი.
იგივე ხდება ესპანურ ენაზე. თუ ამ სტატიას მაგალითის სახით ავიღებთ, დავინახავთ, რომ სიტყვა "of" 85-ჯერ არის გამოყენებული ყველაზე მეტად გამოყენებული, ხოლო სიტყვა "ლა", რომელიც მეორე ყველაზე მეტად არის გამოყენებული, ითვლება 57-მდე ჯერ
იმის დანახვა, რომ ეს ფენომენი სხვა ენებზე გვხვდება, საინტერესოა იმაზე ფიქრი, თუ როგორ ამუშავებს ადამიანის ტვინი ენას. მიუხედავად იმისა, რომ არსებობს მრავალი კულტურული ფენომენი, რომლებიც ზომავს მრავალი სიტყვის გამოყენებას და მნიშვნელობას, მოცემული ენა არის a კულტურული ფაქტორი თავისთავად, გზა, რომლითაც ყველაზე ხშირად ვიყენებთ სიტყვებს, როგორც ჩანს, დამოუკიდებელი ფაქტორია კულტურა
- შეიძლება დაგაინტერესოთ: "რა არის კულტურული ფსიქოლოგია?"
ფუნქციური სიტყვების სიხშირე
მოდით ვნახოთ შემდეგი ათი სიტყვა: "რა", "საწყისი", "არა", "დან", "the", "the", "is", "and", "in" და "what". რა აქვთ საერთო მათ ყველას? რომლებიც თავისთავად უაზრო სიტყვებია, მაგრამ ირონიულად არის 10 ყველაზე ხშირად გამოყენებული სიტყვა ესპანურ ენაში.
იმის თქმა, რომ მათ მნიშვნელობა არ აქვთ, ვგულისხმობთ იმას, რომ თუ წინადადება იტყვის, რომელშიც არ არსებობს არსებითი სახელი, ზედსართავი სახელი, ზმნა ან ზმნიზედა, წინადადება უაზროა. Მაგალითად:
... და... ... in... ... ერთი... of... ... to... of... ...
მეორეს მხრივ, თუ წერტილებს მნიშვნელობით შეცვლით სიტყვები, შეიძლება გვქონდეს შემდეგი ფრაზა.
მიგელს და ანას ყავისფერი მაგიდა აქვთ სახლში საწოლთან.
ეს ხშირად გამოყენებული სიტყვებია ცნობილი როგორც ფუნქციური სიტყვები და მათ ევალებათ წინადადების გრამატიკული სტრუქტურის მიცემა. ისინი მხოლოდ ის 10 არ არის, რაც ჩვენ ვნახეთ, სინამდვილეში ისინი ათობით არის და ყველა მათგანი ესპანურ ენაში ას ყველაზე ხშირად გამოყენებულ სიტყვას შორისაა.
მიუხედავად იმისა, რომ ისინი თავისთავად უაზროდ არიან, შეუძლებელია რომელიმე წინადადებაში გამოტოვება, რომლის გაგებაც გინდა. აუცილებელია, რომ ადამიანები, გაგზავნონ გზავნილი ეფექტურად, მიმართონ სიტყვებს, რომლებიც წინადადების სტრუქტურას წარმოადგენს. ამ მიზეზით, ისინი, საინტერესოა, ყველაზე მეტად იყენებენ.
გამოძიება
მიუხედავად იმისა, რასაც ჯორჯ ზიფმა შეადარა შედარებითი ფილოსოფია, შედარებით ბოლო დრომდე შეუძლებელი იყო კანონის პოსტულატების ემპირიული განხილვა. არა იმიტომ, რომ მატერიალურად შეუძლებელი იყო ყველა საუბრის ან ტექსტის გაანალიზება ინგლისურ ენაზე, ან ნებისმიერ სხვა ენაზე, არამედ დამაშინებელი ამოცანისა და დიდი ძალისხმევის გამო.
საბედნიეროდ, და თანამედროვე გამოთვლითი და კომპიუტერული პროგრამების არსებობის წყალობით, ეს უკვე მოხდა შესაძლებელია გამოიკვლიოს იყო თუ არა ეს კანონი ისე, როგორც Zipf– მა თავდაპირველად შემოგვთავაზა იგი ვარიაციები.
ერთი შემთხვევაა მათემატიკური კვლევის ცენტრის (CRM, კატალონიურ ცენტრში დე რეცერკა მატემატიკა) მიერ ჩატარებული კვლევა, რომელიც უკავშირდება ბარსელონას ავტონომიურ უნივერსიტეტს. მკვლევარებმა varlvaro Corral, Isabel Moreno García და Francesc Font Clos ჩაატარეს ყოვლისმომცველი ანალიზი მასშტაბი, რომელშიც მათ გაანალიზეს ათასობით ციფრული ტექსტი ინგლისურ ენაზე, რომ შეესწავლათ რამდენად მართალი იყო ზიპფის კანონი.
მისმა მუშაობამ, რომელშიც გაანალიზებული იყო ვრცელი კორპუსი, დაახლოებით 30 000 ტომი, საშუალება მისცა მას მიეღო ზიპფის კანონის ექვივალენტი კანონი., რომელშიც ჩანს, რომ ყველაზე ხშირად გამოყენებული სიტყვა ორჯერ უფრო მეტი იყო გამოყენებული, ვიდრე მეორე და ა.შ.
ზიპფის კანონი სხვა კონტექსტებში
მიუხედავად იმისა, რომ ზიპფის კანონი თავდაპირველად გამოიყენებოდა თითოეულ ენაში გამოყენებული სიტყვების სიხშირის ასახსნელად, მისი გარეგნული ასორტიმენტის შედარება ტექსტებსა და საუბრებში მის რეალურ სიხშირესთან, იგი ასევე ექსტრაპოლირებულია სხვათათვის სიტუაციები.
საკმაოდ გასაოცარი შემთხვევაა აშშ – ს დედაქალაქებში მცხოვრები ადამიანების რაოდენობა. ზიპფის კანონის თანახმად, ყველაზე ხალხმრავალ ამერიკულ დედაქალაქს ჰქონდა ორჯერ უფრო დიდი, ვიდრე მეორე, ხოლო სამჯერ მეტი, ვიდრე მესამე ყველაზე დასახლებული.
თუ 2010 წლის მოსახლეობის აღწერას გადავხედავთ, ეს თანახმაა. ნიუ – იორკის მოსახლეობა 8,175,133 ადამიანი იყო, ხოლო შემდეგი ყველაზე დასახლებული დედაქალაქი იყო ლოს – ანჯელესი 3,792,621 და შემდეგი დედაქალაქები რეიტინგში, ჩიკაგო, ჰიუსტონი და ფილადელფია 2,695,598, 2,100,263 და 1,526,006 შესაბამისად
ეს ასევე ჩანს ესპანეთის ყველაზე დასახლებული ქალაქების შემთხვევაში, თუმცა ზიპფის კანონი არ მოქმედებს. იგი სრულად შეესაბამება, მაგრამ მეტნაკლებად, შესაბამისად, შეესაბამება იმ დონეს, რომელსაც თითოეული ქალაქი იკავებს რეიტინგში. მადრიდს, რომლის 3 266 126 მოსახლეობა ორჯერ მეტია, ვიდრე ბარსელონას, 1,636,762, ხოლო ვალენსიაში დაახლოებით მესამედია 800,000 მცხოვრებით.
ზიპფის კანონის კიდევ ერთი თვალსაჩინო შემთხვევაა ვებ – გვერდები. კიბერსივრცე ძალიან ფართოა, თითქმის 15 მილიარდი ვებგვერდი შეიქმნა. იმის გათვალისწინებით, რომ მსოფლიოში დაახლოებით 6,800 მილიონი ადამიანი ცხოვრობს, თეორიულად თითოეული მათგანისთვის დღეში ორი ვებ – გვერდი უნდა იყოს, რაც ასე არ არის.
ამჟამად ყველაზე ხშირად მონახულებული ათი გვერდია: Google (ყოველთვიურად 60,49 მილიონი ვიზიტი), Youtube (24,31 მილიონი), Facebook (19,98 მილიონი), Baidu (9,77 მილიონი), ვიკიპედია (4,69 მილიონი), ტვიტერი (3,92 მილიონი), Yahoo (3,74 მილიონი), პორნჰაბი (3,36 მილიონი), ინსტაგრამი (3,21 მილიონი) და Xvideos (3, 19 მილიონი) მილიონი). ამ ციფრების დათვალიერებისას, თქვენ ხედავთ, რომ Google- ს ორჯერ მეტი ეწვია YouTube– ზე, სამჯერ მეტი Facebook– ზე, ოთხჯერ მეტი ვიდრე Baidu ...
ბიბლიოგრაფიული ცნობარი:
- ფონტ-კლოსი, ფ., ბოლედა, გ. და Corral, Á. (2013) მასშტაბური კანონი Zipf- ის კანონის მიღმა და მისი დამოკიდებულება Heaps- ის კანონთან მიღმა. ფიზიკის ახალი ჟურნალი, 15. doi.org/10.1088/1367-2630/15/9/093033.
- მონტემურო, მ. რომ (2001). ზიპფის მიღმა - მანდელბროტის კანონი რაოდენობრივ ენათმეცნიერებაში. Physica A: სტატისტიკური მექანიკა და მისი გამოყენება 300: 567-578.