Education, study and knowledge

Legea lui Zipf: un fenomen social și matematic curios

Folosim zilnic mii de cuvinte, cu semnificații de tot felul și aparținând unor categorii gramaticale foarte variate. Cu toate acestea, nu toate sunt utilizate cu aceeași frecvență. În funcție de cât de importante sunt pentru structura propoziției, există cuvinte care sunt mai recurente decât altele.

Legea lui Zipf este un postulat care ia în considerare acest fenomen și specifică cât de probabil este să fie folosit un cuvânt pe baza poziției sale în clasamentul tuturor cuvintelor folosite într-o limbă. În continuare vom intra în mai multe detalii despre această lege.

  • Articol asociat: "Cele 12 tipuri de limbaj (și caracteristicile lor)"

Legea lui Zipf

George Kingsley Zipf (1902–1950) a fost un lingvist american, născut în Freeport, Illinois, care a întâlnit un fenomen curios în studiile sale de filologie comparată. În lucrarea sa, în care efectua analize statistice, a constatat că cuvintele cele mai folosite păreau să aibă un tipar de aspect, aceasta fiind nașterea legii care îi primește numele de familie.

instagram story viewer

Conform legii Zipf, în marea majoritate a timpului, dacă nu întotdeauna, cuvintele care sunt folosite într-un text scris sau într-o conversație orală vor urma următorul model: cel mai folosit cuvânt, care ar ocupa prima poziție în clasament, ar fi folosit de două ori mai des decât al doilea cel mai folosit, de trei ori mai mare decât al treilea, de patru ori mai mare decât al patrulea și așa mai departe succesiv.

În termeni matematici, această lege ar fi:

Pn ≈ 1⁄na

Unde „Pn” este frecvența unui cuvânt în ordinea „n” și exponentul „a” este de aproximativ 1.

Ar trebui spus că George Zipf nu a fost singurul care a observat această regularitate în frecvența celor mai folosite cuvinte a multor limbi, atât naturale, cât și artificiale. De fapt, se știe că au existat și alții, precum steganograful Jean-Baptiste Estoup și fizicianul Felix Auerbach.

Zipf a studiat acest fenomen cu texte în engleză și, aparent, este adevărat. Dacă luăm versiunea originală a Originea speciilor de Charles Darwin (1859) vedem că cel mai folosit cuvânt din primul capitol este „cel”, cu o înfățișare de aproximativ 1.050, în timp ce al doilea este „și”, care apare de aproximativ 400 de ori, iar al treilea este „la”, care apare aproximativ 300. Deși nu este exact, puteți vedea că al doilea cuvânt apare de jumătate de ori cât primul și al treilea un al treilea.

Același lucru se întâmplă și în spaniolă. Dacă luăm ca exemplu același articol, putem vedea că cuvântul „a” este folosit de 85 de ori, fiind cel mai folosit, în timp ce cuvântul „la”, care este al doilea cel mai folosit, poate fi numărat până la 57 ori.

Văzând că acest fenomen apare în alte limbi, devine interesant să ne gândim la modul în care creierul uman procesează limbajul. Deși există multe fenomene culturale care au măsurat utilizarea și semnificația multor cuvinte, limba în cauză fiind a factor cultural în sine, modul în care folosim cuvintele cele mai folosite pare a fi un factor independent al cultură.

  • S-ar putea să vă intereseze: "Ce este psihologia culturală?"

Frecvența cuvintelor funcționale

Să ne uităm la următoarele zece cuvinte: „ce”, „de la”, „nu”, „la”, „cel”, „cel”, „este”, „și”, „în” și „ce”. ce au toate în comun? Care sunt cuvinte fără sens pe cont propriu, dar ironic sunt cele mai folosite 10 cuvinte în limba spaniolă.

Spunând că le lipsește sensul, vrem să spunem că, dacă se spune o propoziție în care nu există substantiv, adjectiv, verb sau adverb, propoziția nu are sens. De exemplu:

… Și …… în …… unul… din …… în… din ……

Pe de altă parte, dacă înlocuim punctele cu cuvinte cu semnificație, putem avea o frază ca următoarea.

Miguel și Ana au o masă maro lângă patul lor acasă.

Aceste cuvinte frecvent utilizate sunt ceea ce sunt cuvinte funcționale cunoscute și Ei sunt însărcinați cu acordarea unei structuri gramaticale propoziției. Acestea nu sunt doar cele 10 pe care le-am văzut, de fapt sunt zeci și toate sunt printre cele mai folosite sute de cuvinte în spaniolă.

Deși sunt lipsite de sens pe cont propriu, sunt imposibil de omis în orice propoziție pe care doriți să o înțelegeți. Este necesar ca ființele umane, pentru a transmite un mesaj eficient, să recurgem la cuvinte care constituie structura propoziției. Din acest motiv, ele sunt, curios, cele mai utilizate.

Investigație

În ciuda celor observate de George Zipf în studiile sale de filozofie comparativă, până relativ recent nu fusese posibil să se abordeze empiric postulatele legii. Nu pentru că a fost imposibil din punct de vedere material să analizăm toate conversațiile sau textele în limba engleză sau în orice altă limbă, ci din cauza sarcinii descurajante și a efortului mare implicat.

Din fericire și datorită existenței de calcul și software modern, a fost Este posibil să se investigheze dacă această lege a fost dată în modul în care Zipf a propus-o la început sau dacă a existat variații.

Un caz este cercetarea efectuată de Centrul pentru Cercetări Matematice (CRM, în Catalan Centre de Recerca Matemàtica) legat de Universitatea Autonomă din Barcelona. Cercetătorii Álvaro Corral, Isabel Moreno García și Francesc Font Clos au efectuat o analiză cuprinzătoare scară în care au analizat mii de texte digitalizate în limba engleză pentru a vedea cât de adevărată era legea Zipf.

Opera sa, în care a fost analizat un corpus extins de aproximativ 30.000 de volume, i-a permis să obțină o lege echivalentă cu cea a Zipf, în care s-a văzut că cel mai folosit cuvânt era de două ori mai folosit decât al doilea, și așa mai departe.

Legea Zipf în alte contexte

Deși legea Zipf a fost inițial folosită pentru a explica frecvența cuvintelor folosite în fiecare limbă, comparând gama sa de aparență cu frecvența sa reală în texte și conversații, a fost, de asemenea, extrapolată la altele situații.

Un caz destul de izbitor este numărul de persoane care locuiesc în capitalele SUA. Conform legii Zipf, cea mai populată capitală a Americii avea de două ori mărimea celei de-a doua cele mai populate și de trei ori mai mare decât a treia cea mai populată.

Dacă vă uitați la recensământul populației din 2010, acest lucru este de acord. New York avea o populație totală de 8.175.133 persoane, următoarea cea mai populată capitală fiind Los Angeles, cu 3.792.621 și următoarele capitale din clasament, Chicago, Houston și Philadelphia cu 2.695.598, 2.100.263 și 1.526.006, respectiv

Acest lucru poate fi văzut și în cazul celor mai populate orașe din Spania, deși legea Zipf nu se aplică. Este pe deplin conform, dar corespunde, într-o măsură mai mare sau mai mică, cu rangul pe care fiecare oraș îl ocupă în clasament. Madrid, cu o populație de 3.266.126, are de două ori mai mult decât Barcelona, ​​cu 1.636.762, în timp ce Valencia are aproximativ o treime cu 800.000 de locuitori.

Un alt caz observabil al legii Zipf este legat de paginile web. Spațiul cibernetic este foarte extins, cu aproape 15 miliarde de pagini web create. Având în vedere că în lume există aproximativ 6.800 de milioane de oameni, teoretic pentru fiecare dintre aceștia ar exista două pagini web de vizitat în fiecare zi, ceea ce nu este cazul.

Cele mai vizitate zece pagini în prezent sunt: ​​Google (60,49 milioane de vizite lunare), Youtube (24,31 milioane), Facebook (19,98 milioane), Baidu (9,77 milioane), Wikipedia (4,69 milioane), Twitter (3,92 milioane), Yahoo (3,74 milioane), Pornhub (3,36 milioane), Instagram (3,21 milioane) și Xvideos (3, 19 milioane). Privind aceste numere, puteți vedea că Google este de două ori mai vizitat decât YouTube, de trei ori mai mult decât Facebook, de peste patru ori mai mult decât Baidu ...

Referințe bibliografice:

  • Font-Clos, F., Boleda, G. și Corral, Á. (2013) O lege de scalare dincolo de legea Zipf și relația sa cu legea lui Heaps. New Journal of Physics, 15. doi.org/10.1088/1367-2630/15/9/093033.
  • Montemurro, M. LA. (2001). Dincolo de legea Zipf - Mandelbrot în lingvistică cantitativă. Physica A: Mecanica statistică și aplicațiile sale 300: 567-578.

Ce este o mișcare de artă?

Romantism, impresionism, simbolism, suprarealism... Fără îndoială, toate sunt mișcări artistice p...

Citeste mai mult

Iubirea romantică a existat în Evul Mediu?

În prezent, este destul de în vogă să vorbim despre "iubire romantica”, care a căpătat în ultima ...

Citeste mai mult

9 poezii de prietenie esențiale pentru viață

Se spune că „cine are un prieten are o comoară”. Prietenia, acea relație ciudată de încredere, dr...

Citeste mai mult