Education, study and knowledge

La legge di Zipf: un curioso fenomeno sociale e matematico

Usiamo migliaia di parole ogni giorno, con significati di ogni tipo e appartenenti a categorie grammaticali molto variegate. Tuttavia, non tutti vengono utilizzati con la stessa frequenza. A seconda di quanto sono importanti per la struttura della frase, ci sono parole che sono più ricorrenti di altre.

La legge di Zipf è un postulato che tiene conto di questo fenomeno e specifica la probabilità di utilizzo di una parola in base alla sua posizione nella classifica di tutte le parole utilizzate in una lingua. Successivamente entreremo più in dettaglio su questa legge.

  • Articolo correlato: "I 12 tipi di linguaggio (e le loro caratteristiche)"

La legge di Zipf

George Kingsley Zipf (1902-1950) è stato un linguista americano, nato a Freeport, Illinois, che ha incontrato un curioso fenomeno nei suoi studi di filologia comparata. Nel suo lavoro, in cui stava conducendo analisi statistiche, ha scoperto che le parole più usate sembravano avere un modello di apparenza, essendo questa la nascita della legge che riceve il suo cognome.

instagram story viewer

Secondo la legge di Zipf, nella stragrande maggioranza delle volte, se non sempre, le parole che vengono usate in un testo scritto o in una conversazione orale seguiranno il seguente schema: la parola più usata, che occuperebbe la prima posizione in graduatoria, sarebbe usata il doppio di il secondo più usato, tre volte il terzo, quattro volte il quarto, e così via successivamente.

In termini matematici, questa legge sarebbe:

Pn ≈ 1⁄na

Dove 'Pn' è la frequenza di una parola nell'ordine 'n' e l'esponente 'a' è approssimativamente 1.

Va detto che George Zipf non è stato l'unico ad osservare questa regolarità nella frequenza delle parole più usate di molte lingue, sia naturali che artificiali. Si sa infatti che ne esistevano altri, come lo steganografo Jean-Baptiste Estoup e il fisico Felix Auerbach.

Zipf ha studiato questo fenomeno con testi in inglese e, a quanto pare, è vero. Se prendiamo la versione originale di L'origine delle specie di Charles Darwin (1859) vediamo che la parola più usata nel primo capitolo è "il", con un aspetto di circa 1.050, mentre il secondo è "e", che appare circa 400 volte, e il terzo è "a", che appare circa 300. Anche se non esattamente, puoi vedere che la seconda parola appare la metà delle volte della prima e la terza un terzo.

La stessa cosa succede in spagnolo. Se prendiamo questo stesso articolo come esempio, possiamo vedere che la parola "di" è usata 85 volte, essendo la più usata, mentre la parola "la", che è la seconda più usata, si può contare fino a 57 volte.

Vedendo che questo fenomeno si verifica in altre lingue, diventa interessante pensare a come il cervello umano elabora il linguaggio. Sebbene ci siano molti fenomeni culturali che misurano l'uso e il significato di molte parole, la lingua in questione è una fattore culturale in sé, il modo in cui usiamo le parole più usate sembra essere un fattore indipendente dalla cultura.

  • Potresti essere interessato: "Che cos'è la psicologia culturale?"

Frequenza delle parole di funzione

Diamo un'occhiata alle seguenti dieci parole: "cosa", "da", "non", "a", "il", "il", "è", "e", "in" e "cosa". cosa hanno in comune tutti? Che sono parole senza senso da sole ma ironicamente sono le 10 parole più usate nella lingua spagnola.

Dicendo che mancano di significato, intendiamo che, se viene pronunciata una frase in cui non c'è sostantivo, aggettivo, verbo o avverbio, la frase è priva di significato. Per esempio:

… E…… in…… uno… di…… a… di……

Se invece sostituiamo i punti con parole con significato, possiamo avere una frase come la seguente.

Miguel e Ana hanno un tavolo marrone vicino al loro letto a casa.

Queste parole usate di frequente sono le parole di funzione note e known Hanno il compito di dare una struttura grammaticale alla frase. Non sono solo le 10 che abbiamo visto, infatti ce ne sono decine, e tutte sono tra le cento parole più usate in spagnolo.

Sebbene siano privi di significato da soli, sono impossibili da omettere in qualsiasi frase a cui vuoi dare un senso. È necessario che gli esseri umani, per trasmettere efficacemente un messaggio, ricorrano a parole che costituiscono la struttura della frase. Per questo motivo sono, curiosamente, i più utilizzati.

Indagine

Nonostante quanto osservato da George Zipf nei suoi studi di filosofia comparata, fino a tempi relativamente recenti non era stato possibile affrontare empiricamente i postulati del diritto. Non perché fosse materialmente impossibile analizzare tutte le conversazioni oi testi in inglese, o in qualsiasi altra lingua, ma a causa del compito arduo e del grande sforzo richiesto.

Fortunatamente, e grazie all'esistenza di computer e software moderni, è stato È possibile indagare se questa legge è stata data nel modo in cui Zipf l'ha proposta all'inizio o se c'era variazioni.

Un caso è la ricerca svolta dal Centro di Ricerca Matematica (CRM, in catalano Centre de Recerca Matemàtica) legato all'Università Autonoma di Barcellona. I ricercatori Álvaro Corral, Isabel Moreno García e Francesc Font Clos hanno effettuato un'analisi completa scala in cui hanno analizzato migliaia di testi digitalizzati in inglese per vedere quanto fosse vera la legge di Zipf.

Il suo lavoro, in cui è stato analizzato un vasto corpus di circa 30.000 volumi, gli ha permesso di ottenere una legge equivalente a quella di Zipf, in cui si vedeva che la parola più usata era usata il doppio della seconda, e così via.

La legge Zipf in altri contesti

Sebbene la legge di Zipf fosse originariamente usata per spiegare la frequenza delle parole usate in ogni lingua, confrontando il suo raggio di apparizione con la sua reale frequenza nei testi e nelle conversazioni, è stato anche estrapolato ad altri situazioni.

Un caso piuttosto eclatante è il numero di persone che vivono nelle capitali degli Stati Uniti. Secondo la legge di Zipf, la capitale americana più popolosa aveva il doppio della seconda più popolosa e il triplo della terza più popolosa.

Se guardi il censimento della popolazione del 2010, questo è d'accordo. New York aveva una popolazione totale di 8,175,133 persone, con la capitale più popolosa dopo Los Angeles, con 3.792.621 e le seguenti capitali della classifica, Chicago, Houston e Philadelphia con 2.695.598, 2.100.263 e 1.526.006, rispettivamente

Questo si può vedere anche nel caso delle città più popolose della Spagna, sebbene la legge di Zipf non si applichi. È pienamente conforme, ma corrisponde, in misura maggiore o minore, al rango che ciascuna città occupa nel classifica. Madrid, con una popolazione di 3.266.126 ha il doppio di quella di Barcellona, ​​​​con 1.636.762, mentre Valencia ne ha circa un terzo con 800.000 abitanti.

Un altro caso osservabile della legge di Zipf è con le pagine web. Il cyberspazio è molto vasto, con quasi 15 miliardi di pagine web create. Tenendo conto che nel mondo ci sono circa 6.800 milioni di persone, in teoria per ognuna di esse ci sarebbero due pagine web da visitare ogni giorno, il che non è il caso.

Le dieci pagine più visitate al momento sono: Google (60,49 milioni di visite mensili), Youtube (24,31 milioni), Facebook (19,98 milioni), Baidu (9,77 milioni), Wikipedia (4,69 milioni), Twitter (3,92 milioni), Yahoo (3,74 milioni), Pornhub (3,36 milioni), Instagram (3,21 milioni) e Xvideos (3, 19 milioni). Guardando questi numeri, puoi vedere che Google è visitato il doppio di YouTube, tre volte più di Facebook, più di quattro volte più di Baidu...

Riferimenti bibliografici:

  • Font-Clos, F., Boleda, G. e Corral,. (2013) Una legge di scala oltre la legge di Zipf e la sua relazione con la legge di Heaps. Nuovo giornale di fisica, 15. doi.org/10.1088/1367-2630/15/9/093033.
  • Montemurro, M. PER. (2001). Oltre la legge Zipf – Mandelbrot in linguistica quantitativa. Physica A: Meccanica statistica e sue applicazioni 300: 567-578.

Perché le donne fanno pagare di meno? 5 cause del divario salariale

Il divario salariale è una questione che non è stata del tutto chiarita. Negli ultimi decenni, la...

Leggi di più

50 parole con doppi significati (e loro possibili significati)

Le parole polisemiche sono parole che si scrivono esattamente allo stesso modo, ma hanno signific...

Leggi di più

11 film sui disturbi alimentari

Il cinema è un'arte e, allo stesso tempo, uno strumento che ci permette di riflettere e rendere v...

Leggi di più