Education, study and knowledge

Zipfi seadus: kurioosne sotsiaalne ja matemaatiline nähtus

Me kasutame iga päev tuhandeid sõnu, millel on igasugused tähendused ja mis kuuluvad väga erinevatesse grammatilistesse kategooriatesse. Kõiki neid ei kasutata siiski sama sagedusega. Sõltuvalt sellest, kui olulised nad lause ülesehituse jaoks on, on sõnu, mis on korduvamad kui teised.

Zipfi seadus on postulaat, mis seda nähtust arvesse võtab ja täpsustab sõna kasutamise tõenäosust, lähtudes selle positsioonist kõigi keeles kasutatavate sõnade pingerida. Järgmisena käsitleme seda seadust üksikasjalikumalt.

  • Seotud artikkel: "12 keeletüüpi (ja nende tunnused)"

Zipfi seadus

George Kingsley Zipf (1902–1950) oli Ameerika Ühendriikide keeleteadlane, sündinud Illinoisi osariigis Freeportis ja kohtus võrdleva filoloogia uurimisel uudishimuliku nähtusega. Oma töös, milles ta viis läbi statistilisi analüüse, leidis ta seda tundus, et enimkasutatavatel sõnadel on välimus, see on tema perekonnanime saanud seaduse sünd.

Zipfi seaduse kohaselt on valdavas enamuses ajast, kui mitte alati, sõnad, mida kasutatakse kirjalikus tekstis või suulises vestluses, järgivad järgmist mustrit

instagram story viewer
: kõige sagedamini kasutatavat sõna, mis hõivaks edetabelis esimese positsiooni, kasutataks kaks korda sagedamini kui teine ​​enimkasutatud, kolm korda rohkem kui kolmas, neli korda rohkem kui neljas jne järjestikku.

Matemaatilises mõttes oleks see seadus järgmine:

Pn ≈ 1⁄na

Kus 'Pn' on sõna sagedus järjekorras n ja eksponent 'a' on umbes 1.

Seda peaks ütlema George Zipf ei olnud ainus, kes täheldas seda seaduspärasust enamkasutatavate sõnade sageduses paljudest nii looduslikest kui ka kunstlikest keeltest. Tegelikult on teada, et oli ka teisi, näiteks steganograaf Jean-Baptiste Estoup ja füüsik Felix Auerbach.

Zipf uuris seda nähtust ingliskeelsete tekstidega ja ilmselt on see tõsi. Kui võtame algse versiooni Liikide päritolu autor Charles Darwin (1859) näeme, et esimeses peatükis on kõige enam kasutatud sõna "the", mille välimus on umbes 1050, samal ajal kui teine ​​on "ja", mis ilmub umbes 400 korda, ja kolmas on "kuni" umbes 300. Kuigi mitte täpselt, näete, et teist sõna esineb poole vähem kui esimest ja kolmandat kolmandikku.

Sama juhtub ka hispaania keeles. Kui võtame selle sama artikli näitena, näeme, et sõna "of" kasutatakse 85 korda, olles enimkasutatav, samas kui sõna "la", mis on enimkasutatud, võib lugeda kuni 57-ni korda.

Nähes, et see nähtus esineb teistes keeltes, on huvitav mõelda, kuidas inimese aju keelt töötleb. Kuigi on palju kultuurinähtusi, mis mõõtsid paljude sõnade kasutamist ja tähendust, oli kõnealune keel a kultuuritegur iseenesest tundub, et viis, kuidas me enimkasutatavaid sõnu kasutame, on kultuur.

  • Võite olla huvitatud: "Mis on kultuuripsühholoogia?"

Funktsioonisõnade sagedus

Vaatame järgmist kümmet sõna: „mis”, „kust”, „mitte”, „kuni”, „the”, „the”, „on”, „ja”, „sisse” ja „mis”. mis on neil kõigil ühist? Mis on üksi mõttetud sõnad, kuid irooniliselt on kümme kõige enam kasutatavat sõna hispaania keeles.

Öeldes, et neil puudub tähendus, peame silmas seda, et kui öeldakse lause, milles puudub nimisõna, omadussõna, tegusõna või määrsõna, pole see lause mõttetu. Näiteks:

… Ja…… üks…… üks…… kuni…

Teisest küljest, kui asendada punktid sõnadega, millel on tähendus, võib meil olla selline fraas nagu järgmine.

Miguelil ja Anal on kodus voodi kõrval pruun laud.

Need sageli kasutatavad sõnad on tuntud funktsioonisõnad ja Nende ülesandeks on anda lause grammatiline ülesehitus. Need pole mitte ainult kümme, mida oleme näinud, tegelikult on neid kümneid ja kõik nad kuuluvad saja hispaaniakeelseima sõna hulka.

Kuigi nad on omaette mõttetud, on võimatu välja jätta ühestki lausest, mida soovite mõtestada. Inimene peab sõnumi tõhusaks edastamiseks kasutama sõnu, mis moodustavad lause struktuuri. Sel põhjusel on neid uudishimulikult kõige rohkem kasutatud.

Uurimine

Vaatamata sellele, mida George Zipf võrdleva filosoofia uurimisel täheldas, veel suhteliselt hiljuti ei olnud võimalik seaduse postulaate empiiriliselt käsitleda. Mitte sellepärast, et kõiki vestlusi või tekste oleks olnud võimatu analüüsida inglise keeles või mõnes muus keeles, vaid hirmuäratava ülesande ja sellega kaasnenud suure pingutuse tõttu.

Õnneks ja tänu kaasaegse arvutustehnika ja tarkvara olemasolule on see nii olnud On võimalik uurida, kas see seadus anti nii, nagu Zipf selle alguses välja pakkus, või oli variatsioonid.

Üks juhtum on Barcelona Autonoomse Ülikooliga seotud matemaatiliste uuringute keskuse (CRM, Kataloonia Centre de Recerca Matemàtica) tehtud uuring. Teadlased Álvaro Corral, Isabel Moreno García ja Francesc Font Clos viisid läbi põhjaliku analüüsi skaala, milles nad analüüsisid tuhandeid ingliskeelseid digiteeritud tekste, et näha, kui tõene oli Zipfi seadus.

Tema töö, milles analüüsiti ulatuslikku umbes 30 000 köidet sisaldavat korpust, võimaldas tal saada Zipfi omaga samaväärse seaduse, milles nähti, et enimkasutatavat sõna kasutati kaks korda rohkem kui teist jne.

Zipfi seadus muudes kontekstides

Kuigi Zipfi seadust kasutati algselt igas keeles kasutatavate sõnade sageduse selgitamiseks, võrreldes oma väljanägemist tegeliku sagedusega tekstides ja vestlustes, on see ka teistele ekstrapoleeritud olukordades.

Üsna silmatorkav juhtum on USA pealinnades elavate inimeste arv. Zipfi seaduse järgi oli Ameerika rahvaarvukam pealinn kaks korda suurem kui rahvaarvult teine ​​ja kolm korda suurem kui elanike arvult kolmas.

Kui vaadata 2010. aasta rahvaloendust, siis see nõustub. New Yorgis elas kokku 8 175 133 inimest, rahvaarvult järgmine pealinn oli Los Angeles 3 792 621 ja järgmised pealinna pealinnad, Chicago, Houston ja Philadelphia, 2 695 598, 2 100 263 ja 1 526 006, vastavalt

Seda on näha ka Hispaania kõige suurema asustusega linnade puhul, kuigi Zipfi seadust ei kohaldata. See vastab täielikult nõuetele, kuid vastab suuremal või vähemal määral sellele, millisele auastmele iga linn linnas kuulub paremusjärjestus. 3 266 126 elanikuga Madridil on Barcelona omast kaks korda suurem, 1636 762, Valencial aga umbes kolmandik 800 000 elanikuga.

Teine vaadeldav Zipfi seaduse juhtum on veebilehtedega. Küberruum on väga ulatuslik, loodud on ligi 15 miljardit veebilehte. Võttes arvesse, et maailmas on umbes 6800 miljonit inimest, oleks teoreetiliselt igaühe jaoks kaks veebilehte, mida iga päev külastada, mis pole nii.

Kümme enim külastatud lehte on praegu: Google (60,49 miljonit külastust kuus), Youtube (24,31 miljonit), Facebook (19,98 miljonit), Baidu (9,77 miljonit), Wikipedia (4,69 miljonit), Twitter (3,92 miljonit), Yahoo (3,74 miljonit), Pornhub (3,36 miljonit), Instagram (3,21 miljonit) ja Xvideos (3, 19) miljonid). Neid numbreid vaadates näete, et Google on külastatud kaks korda rohkem kui YouTube, kolm korda rohkem kui Facebook, üle nelja korra rohkem kui Baidu ...

Bibliograafilised viited:

  • Font-Clos, F., Boleda, G. ja Corral, Á. (2013) Mastaapne seadus, mis ületab Zipfi seadust ja selle seost Heapsi seadusega. Uus ajakiri Füüsika, 15. doi.org/10.1088/1367-2630/15/9/093033.
  • Montemurro, M. TO. (2001). Beyond the Zipf - Mandelbroti seadus kvantitatiivses lingvistikas. Physica A: Statistiline mehaanika ja selle rakendused 300: 567-578.
Vana-Rooma 3 etappi: selle ajalugu ja omadused

Vana-Rooma 3 etappi: selle ajalugu ja omadused

Me kõik teame Vana-Rooma, aga... Kas me teame, millisteks etappideks selle ajalugu jaguneb ja mil...

Loe rohkem

15 veidrat filmi, mida peaksite täna nägema

Läbi ajaloo on kunsti avaldumine olnud kultuuride ja ühiskondade arengus väga oluline konstant.Er...

Loe rohkem

15 parimat hispaania kirjanduse teost

15 parimat hispaania kirjanduse teost

Kui olete paadunud lugeja, siis kõlab teile tuttavalt ütlus "maailma kõigi raamatute lugemiseks p...

Loe rohkem