Education, study and knowledge

Zipf törvénye: kíváncsi társadalmi és matematikai jelenség

click fraud protection

Naponta több ezer szót használunk, mindenféle jelentéssel és nagyon változatos nyelvtani kategóriákhoz tartozóan. Azonban nem mindegyiket használják azonos frekvenciával. Attól függően, hogy mennyire fontosak a mondat felépítése szempontjából, vannak olyan szavak, amelyek ismétlődőbbek, mint mások.

A Zipf-törvény egy posztulátum, amely figyelembe veszi ezt a jelenséget és meghatározza, hogy mennyire valószínű egy szó, annak helyzete alapján a nyelvben használt összes szó rangsorában. Ezután részletesebben foglalkozunk ezzel a törvénnyel.

  • Kapcsolódó cikk: "A 12 nyelvtípus (és jellemzőik)"

Zipf törvénye

George Kingsley Zipf (1902–1950) amerikai nyelvész, az Illinois állambeli Freeportban született, és az összehasonlító filológia tanulmányai során furcsa jelenséggel találkozott. Munkájában, amelyben statisztikai elemzéseket végzett, megállapította a leggyakrabban használt szavaknak látszólag mintás volt a megjelenésük, ez a törvény születése, amely megkapja a vezetéknevét.

A Zipf törvénye szerint az esetek döntő többségében, ha nem is mindig,

instagram story viewer
az írott szövegben vagy a szóbeli beszélgetésben használt szavak a következő mintát követik: a leggyakrabban használt szót, amely a rangsor első helyét foglalná el, kétszer olyan gyakran használnák, mint a a második leggyakrabban használt, háromszor annyiszor, mint a harmadik, négyszer annyiszor, mint a negyedik, és így tovább egymás után.

Matematikai szempontból ez a törvény a következő lenne:

Pn ≈ 1⁄na

Ahol „Pn” az „n” sorrendű szó gyakorisága, az „a” kitevő pedig körülbelül 1.

Azt kell mondani Nem csak Zipf György figyelte meg ezt a törvényszerűséget a leggyakrabban használt szavak gyakoriságában sok nyelvből, mind természetes, mind mesterséges. Valójában ismert, hogy voltak mások, például Jean-Baptiste Estoup szteganográfus és Felix Auerbach fizikus.

Zipf ezt a jelenséget angol nyelvű szövegekkel tanulmányozta, és látszólag igaz is. Ha az eredeti verzióját vesszük A fajok eredete Charles Darwin (1859) azt látjuk, hogy az első fejezetben a leggyakrabban használt szó a "a", kb 1050, míg a második "és", körülbelül 400-szor jelenik meg, a harmadik pedig "-ig" jelenik meg körülbelül 300. Bár nem pontosan, láthatja, hogy a második szó fele annyiszor jelenik meg, mint az első, a harmadik pedig egyharmad.

Ugyanez történik spanyolul. Ha ugyanazt a cikket vesszük példának, láthatjuk, hogy a "of" szót 85 alkalommal használják, vagyis a legtöbbet használt, míg a második leggyakrabban használt "la" szó 57-ig számolható alkalommal.

Látva, hogy ez a jelenség más nyelveken is előfordul, érdekes lesz elgondolkodni azon, hogy az emberi agy hogyan dolgozza fel a nyelvet. Bár sok olyan kulturális jelenség létezik, amely sok szó használatát és jelentését mérte, a szóban forgó nyelv a kulturális tényező önmagában úgy tűnik, hogy a leggyakrabban használt szavak használata független tényező a kultúra.

  • Érdekelheti: "Mi a kulturális pszichológia?"

A függvényszavak gyakorisága

Nézzük meg a következő tíz szót: „mi”, „honnan”, „nem”, „be”, „a”, „a”, „van”, „és”, „benne” és „mi”. mi a közös bennük? Amelyek önmagukban értelmetlen szavak, de ironikusan a 10 leggyakrabban használt szó a spanyol nyelvben.

Ha azt mondjuk, hogy nincs jelentésük, akkor azt értjük, hogy ha olyan mondatot mondunk, amelyben nincs főnév, melléknév, ige vagy határozószó, akkor a mondat értelmetlen. Például:

… És …… -ban …………… egyikében…

Másrészt, ha a pontokat szavakkal helyettesítjük jelentéssel, akkor lehet egy következő mondatunk.

Miguelnek és Anának egy barna asztal van az ágya mellett otthon.

Ezek a gyakran használt szavak az ismert függvényszavak, és Ők felelősek a mondat nyelvtani felépítéséért. Nem csak azok a 10, akiket láttunk, valójában több tucat van, és mindegyik a száz leggyakrabban használt spanyol szó közé tartozik.

Bár önmagukban értelmetlenek, lehetetlen kihagyni egyetlen olyan mondatban sem, amelynek értelmet akar adni. Szükséges, hogy az emberek az üzenet hatékony továbbítása érdekében olyan szavakhoz folyamodjanak, amelyek a mondat felépítését alkotják. Ezért kíváncsiságból a legtöbbet használják őket.

Vizsgálat

Annak ellenére, amit George Zipf megfigyelt az összehasonlító filozófia tanulmányaiban, viszonylag a közelmúltig nem lehetett empirikusan foglalkozni a törvény posztulátumaival. Nem azért, mert anyagilag lehetetlen volt minden beszélgetést vagy szöveget angolul vagy bármely más nyelven elemezni, hanem a félelmetes feladat és az ezzel járó nagy erőfeszítések miatt.

Szerencsére, és a modern számítástechnika és szoftverek meglétének köszönhetően, ez volt Meg lehet vizsgálni, hogy ezt a törvényt úgy adták-e meg, ahogyan a Zipf kezdetben javasolta, vagy voltak variációk.

Az egyik eset a Matematikai Kutatóközpont (CRM, in Catalan Center de Recerca Matemàtica) által végzett kutatás, amely a barcelonai Autonóm Egyetemhez kapcsolódik. Álvaro Corral, Isabel Moreno García és Francesc Font Clos kutatók átfogó elemzést végeztek skála, amelyben több ezer digitalizált szöveget elemeztek angolul, hogy lássák, mennyire igaz a Zipf-törvény.

Munkája, amelynek során mintegy 30 000 kötetből álló kiterjedt korpuszt elemeztek, lehetővé tette, hogy a Zipf törvényével egyenértékű törvényt, amelyben látható volt, hogy a leggyakrabban használt szót kétszer annyian használták, mint a másodikat, és így tovább.

A Zipf-törvény más összefüggésekben

Noha a Zipf-törvényt eredetileg az egyes nyelvekben használt szavak gyakoriságának magyarázatára használták, megjelenési tartományát összehasonlítva a szövegek és beszélgetések valódi gyakoriságával, másokra is extrapolálták helyzetek.

Meglehetősen markáns eset az Egyesült Államok fővárosaiban élők száma. A Zipf-törvény szerint Amerika legnépesebb tőkéje kétszer akkora, mint a második legnépesebb, és háromszorosa a harmadik legnépesebbé.

Ha megnézzük a 2010-es népszámlálást, ez egyetért. New York teljes lakossága 8 175 133 fő volt, a következő legnépesebb főváros Los Angeles volt 3 792 621 és a rangsor következő fővárosa, Chicago, Houston és Philadelphia 2 695 598, 2 100 263 és 1 526 006 ponttal, illetőleg

Ez Spanyolország legnépesebb városai esetében is megfigyelhető, bár a Zipf törvényei nem érvényesek. Teljes mértékben megfelel, de kisebb-nagyobb mértékben megfelel annak a rangnak, amelyet az egyes városok a rangsor. A 3 266 126 lakosú Madrid kétszer akkora, mint Barcelona, ​​1636 762, Valencia pedig 800 000 lakosával mintegy harmada.

A Zipf-törvény másik megfigyelhető esete a weboldalak. A kibertér nagyon kiterjedt, közel 15 milliárd weboldalt hoztak létre. Figyelembe véve, hogy a világon körülbelül 6800 millió ember él, elméletileg mindegyikükhöz két weboldal lenne látogatható naponta, ami nem így van.

A tíz leglátogatottabb oldal jelenleg: Google (havi 60,49 millió látogatás), Youtube (24,31 millió), Facebook (19,98 millió), Baidu (9,77 millió), Wikipédia (4,69 millió), Twitter (3,92 millió), Yahoo (3,74 millió), Pornhub (3,36 millió), Instagram (3,21 millió) és Xvideos (3, 19) millió). Ezeket a számokat megnézve láthatja, hogy a Google kétszer olyan látogatott, mint a YouTube, háromszor annyi, mint a Facebook, több mint négyszer annyi, mint a Baidu ...

Bibliográfiai hivatkozások:

  • Font-Clos, F., Boleda, G. és Corral, Á. (2013) A Zipf törvényén és a Halmok törvényéhez való viszonyán túlmutató méretarányos törvény. New Journal of Physics, 15. doi.org/10.1088/1367-2630/15/9/093033.
  • Montemurro, M. NAK NEK. (2001). A Zipf - Mandelbrot-törvény a kvantitatív nyelvészetben túl. Physica A: Statisztikai mechanika és alkalmazásai 300: 567-578.
Teachs.ru

5 könyvet adni pszichológusnak karácsonykor (2015-ös kiadás)

Igen, tudjuk. Több mint tanulmányozott és dokumentált. A karácsonyi szezon veszedelmesen zárul, é...

Olvass tovább

Újságíró rajzfilmek: mik ezek, jellemzők és példák

Újságíró rajzfilmek: mik ezek, jellemzők és példák

Az újságírói rajzfilm a jelenlegi kommunikáció egyik legerősebb eleme: néhány kép sok mindent kif...

Olvass tovább

14 matematikai rejtvény (és megoldásuk)

A rejtvények az idő eltöltésének játékos módja, olyan rejtvények, amelyekhez meg kell találni int...

Olvass tovább

instagram viewer