Education, study and knowledge

Zipf yasası: meraklı bir sosyal ve matematiksel fenomen

Her gün, her türden anlama sahip ve çok çeşitli gramer kategorilerine ait binlerce kelime kullanıyoruz. Ancak, hepsi aynı frekansta kullanılmamaktadır. Cümle yapısı için ne kadar önemli olduklarına bağlı olarak, diğerlerinden daha fazla tekrar eden kelimeler vardır.

Zipf yasası, bu fenomeni hesaba katan bir varsayımdır. ve bir dilde kullanılan tüm kelimelerin sıralamasındaki konumuna göre bir kelimenin kullanılma olasılığını belirtir. Daha sonra bu yasa hakkında daha fazla ayrıntıya gireceğiz.

  • İlgili makale: "12 dil türü (ve özellikleri)"

Zipf yasası

George Kingsley Zipf (1902–1950), Freeport, Illinois'de doğan ve karşılaştırmalı filoloji çalışmalarında ilginç bir fenomenle karşılaşan Amerikalı bir dilbilimciydi. İstatistiksel analizler yaptığı çalışmasında, şunları buldu: en çok kullanılan kelimelerin bir görünüm kalıbı varmış gibi görünüyordu, bu onun soyadını alan yasanın doğuşudur.

Zipf yasasına göre, her zaman olmasa da çoğu zaman, Yazılı bir metinde veya sözlü bir konuşmada kullanılan kelimeler aşağıdaki kalıbı izleyecektir.

instagram story viewer
: Sıralamada ilk sırada yer alacak en çok kullanılan kelime, kullanılan kelimeden iki kat daha sık kullanılacaktır. ikinci en çok kullanılan, üçüncünün üç katı, dördüncünün dört katı vb. art arda.

Matematiksel olarak, bu yasa şöyle olacaktır:

Pn ≈ 1⁄na

'Pn', 'n' sırasındaki bir kelimenin sıklığı ve 'a' üssü yaklaşık 1'dir.

Söylenmeli ki En çok kullanılan kelimelerin sıklığında bu düzenliliği gözlemleyen tek kişi George Zipf değildi. hem doğal hem de yapay birçok dilde. Aslında steganograf Jean-Baptiste Estoup ve fizikçi Felix Auerbach gibi başkalarının da olduğu biliniyor.

Zipf bu fenomeni İngilizce metinlerle inceledi ve görünüşe göre bu doğru. orjinal halini alırsak Türlerin Kökeni, Charles Darwin (1859) ilk bölümde en çok kullanılan sözcüğün yaklaşık bir görünümle "the" olduğunu görüyoruz. 1.050, ikincisi "ve", yaklaşık 400 kez görünüyor ve üçüncüsü "to" görünüyor yaklaşık 300. Tam olarak olmasa da, ikinci kelimenin birinci kelimenin yarısı kadar ve üçüncü kelimenin üçte bir oranında göründüğünü görebilirsiniz.

Aynı şey İspanyolca'da da oluyor. Aynı makaleyi örnek alırsak, 85 defa "of" kelimesinin kullanıldığını görebiliriz. en çok kullanılan ikinci kelime olan "la" ise 57'ye kadar sayılabilir. zamanlar.

Bu fenomenin diğer dillerde de gerçekleştiğini görünce, insan beyninin dili nasıl işlediğini düşünmek ilginç hale geliyor. Birçok kelimenin kullanımını ve anlamını ölçen birçok kültürel olgu olmasına rağmen, söz konusu dil kültürel faktörün kendi içinde, en çok kullanılan kelimeleri kullanma şeklimizin bağımsız bir faktör olduğu görülmektedir. kültür.

  • İlginizi çekebilir: "Kültürel Psikoloji nedir?"

Fonksiyon kelimelerinin sıklığı

Şu on kelimeye bakalım: 'what', 'from', 'değil', 'to', 'the', 'the', 'is', 've', 'in' ve 'what'. hepsinin ortak noktası ne? Kendi başlarına anlamsız ama ironik olan kelimeler ispanyolcada en çok kullanılan 10 kelime.

Anlamsızlar derken, içinde isim, sıfat, fiil, zarf olmayan bir cümle söylenirse cümlenin anlamsız olduğunu kastediyoruz. Örneğin:

… Ve …… içinde…… bir………………………….

Öte yandan, noktaları anlamlı sözcüklerle değiştirirsek aşağıdaki gibi bir ifade elde edebiliriz.

Miguel ve Ana evde yataklarının yanında kahverengi bir masa var.

Bu sık kullanılan sözcükler, bilinen işlev sözcükleridir ve Cümlenin gramer yapısını vermekle görevlidirler.. Bunlar sadece gördüğümüz 10 değil, aslında onlarcası var ve hepsi İspanyolca'da en çok kullanılan yüz kelime arasında yer alıyor.

Tek başlarına anlamsız olsalar da, anlamlandırmak istediğiniz herhangi bir cümlede atlamak imkansızdır. İnsanoğlunun bir mesajı etkili bir şekilde iletebilmesi için cümlenin yapısını oluşturan kelimelere başvurması gerekmektedir. Bu nedenle, merakla en çok kullanılanlardır.

Soruşturma

George Zipf'in karşılaştırmalı felsefe çalışmalarında gözlemlediğine rağmen, Nispeten yakın zamana kadar, yasanın varsayımlarını ampirik olarak ele almak mümkün olmamıştı.. Tüm konuşmaları veya metinleri İngilizce veya başka bir dilde analiz etmenin maddi olarak imkansız olduğu için değil, göz korkutucu görev ve gerekli büyük çaba nedeniyle.

Neyse ki, modern bilgi işlem ve yazılımın varlığı sayesinde, Bu yasanın Zipf'in başlangıçta önerdiği şekilde mi verildiğini veya var olup olmadığını araştırmak mümkündür. varyasyonlar.

Bir örnek, Barselona Otonom Üniversitesi ile bağlantılı Matematiksel Araştırma Merkezi (CRM, Katalan Center de Recerca Matemàtica'da) tarafından yürütülen araştırmadır. Araştırmacılar Álvaro Corral, Isabel Moreno García ve Francesc Font Clos kapsamlı bir analiz gerçekleştirdi. Zipf yasasının ne kadar doğru olduğunu görmek için İngilizce binlerce sayısallaştırılmış metni analiz ettikleri bir ölçek.

Yaklaşık 30.000 ciltlik kapsamlı bir külliyatın analiz edildiği çalışması, Zipf'inkine eşdeğer bir yasa elde etmesine izin verdi., en çok kullanılan kelimenin ikincinin iki katı olduğu görüldü vb.

Diğer bağlamlarda Zipf yasası

Zipf yasası başlangıçta her dilde kullanılan sözcüklerin sıklığını açıklamak için kullanılmış olsa da, metinlerdeki ve konuşmalardaki gerçek sıklığı ile görünüm aralığını karşılaştırarak, diğerlerine de tahmin edilmiştir. durumlar.

Oldukça çarpıcı bir durum ABD başkentlerinde yaşayan insan sayısı. Zipf yasasına göre, Amerika'nın en kalabalık başkenti, ikinci en kalabalık başkentin iki katı ve en kalabalık üçüncü başkentin üç katı büyüklüğündeydi.

2010 nüfus sayımına bakarsanız, bu aynı fikirde. New York'un toplam nüfusu 8.175.133 kişiydi ve bir sonraki en kalabalık başkent Los Angeles idi. 3.792.621 ve sıralamada aşağıdaki başkentler, 2.695.598, 2.100.263 ve 1.526.006 ile Chicago, Houston ve Philadelphia, sırasıyla

Bu, Zipf yasası geçerli olmasa da İspanya'nın en kalabalık şehirlerinde de görülebilir. Tamamen uyumludur, ancak az ya da çok ölçüde, her bir şehrin bulunduğu sıralamaya tekabül eder. sıralama. Nüfusu 3.266.126 olan Madrid, 1.636.762 ile Barselona'nın iki katı, Valensiya ise 800.000 nüfusla yaklaşık üçte birine sahiptir.

Zipf yasasının gözlemlenebilir bir başka durumu da web sayfalarıyla ilgilidir.. Siber uzay, oluşturulan yaklaşık 15 milyar web sayfasıyla çok kapsamlıdır. Dünyada yaklaşık 6.800 milyon insan olduğu göz önüne alındığında, teorik olarak her biri için her gün ziyaret edilecek iki web sayfası olurdu, ki durum böyle değil.

Şu anda en çok ziyaret edilen on sayfa: Google (aylık 60.49 milyon ziyaret), Youtube (24.31 milyon), Facebook (19.98 milyon), Baidu (9.77 milyon), Wikipedia (4.69 milyon), Twitter (3.92 milyon), Yahoo (3.74 milyon), Pornhub (3.36 milyon), Instagram (3.21 milyon) ve Xvideos (3, 19) milyon). Bu rakamlara bakıldığında Google'ın YouTube'dan iki kat, Facebook'tan üç kat, Baidu'dan dört kat fazla ziyaret edildiğini görebilirsiniz...

Bibliyografik referanslar:

  • Font-Clos, F., Boleda, G. ve Corral, Á. (2013) Zipf yasasının ötesinde bir ölçekleme yasası ve bunun Heaps yasasıyla ilişkisi. Yeni Fizik Dergisi, 15. doi.org/10.1088/1367-2630/15/9/093033.
  • Montemurro, M. İÇİN. (2001). Nicel dilbilimde Zipf – Mandelbrot yasasının ötesinde. Physica A: İstatistiksel Mekanik ve Uygulamaları 300: 567-578.

65 genel kültür sorusu (cevaplarıyla birlikte)

Her şeyi bildiğini mi düşünüyorsun? Genel kültür, yaşam boyunca çeşitli konularda biriktirebildiğ...

Devamını oku

Her sinema tutkununun izlemesi gereken psikopati hakkında 12+1 film

Hepimizin bildiği gibi, figür ruh hastası Sinema dünyasında defalarca kullanılmıştır. Tipik olara...

Devamını oku

İlkokul çocukları için 40 harika soru

İlkokul çocukları için 40 harika soru

Ebeveynler öğrenmeye tamamen dahil olduklarında, çocuklar daha iyi tepki verir. Katılmanın bir yo...

Devamını oku