Education, study and knowledge

Зипфов закон: радознала друштвена и математичка појава

Свакодневно користимо хиљаде речи, са значењима свих врста и које припадају врло различитим граматичким категоријама. Међутим, не користе се сви са истом фреквенцијом. У зависности од тога колико су важне за структуру реченице, постоје речи које се понављају од других.

Зипфов закон је постулат који узима у обзир ову појаву и одређује колико је вероватно да ће се реч употребити на основу њеног положаја у рангирању свих речи које се користе у језику. Следеће ћемо детаљније објаснити овај закон.

  • Повезани чланак: "12 врста језика (и њихове карактеристике)"

Зипфов закон

Георге Кингслеи Зипф (1902–1950) био је амерички лингвиста, рођен у Фреепорту у држави Илиноис, који је наишао на чудан феномен у студијама упоредне филологије. У свом раду, у којем је спроводио статистичке анализе, то је и утврдио чинило се да најчешће коришћене речи имају образац изгледа, ово је рођење закона који прима његово презиме.

Према Зипфовом закону, у великој већини времена, ако не и увек, речи које се користе у писаном тексту или у усменом разговору следиће следећи образац

instagram story viewer
: најчешће коришћена реч која би заузимала прво место на ранг листи била би двоструко чешћа него друга најчешће коришћена, три пута више од треће, четири пута више од четврте итд узастопно.

У математичком смислу, овај закон би био:

Пн ≈ 1⁄на

Где је 'Пн' фреквенција речи у редоследу 'н', а експонент 'а' је приближно 1.

Треба то рећи Георге Зипф није био једини који је уочио ову правилност у учесталости најчешће коришћених речи многих језика, и природних и вештачких. У ствари, познато је да је било и других, попут стеганографа Јеан-Баптисте Естоупа и физичара Фелика Ауербацха.

Зипф је проучавао овај феномен текстовима на енглеском језику и, по свему судећи, то је тачно. Ако узмемо оригиналну верзију Порекло врста Чарлса Дарвина (1859) видимо да је најчешће коришћена реч у првом поглављу „тхе“, са појавом око 1.050, док је друго „и“, појављује се око 400 пута, а треће је „до“ око 300. Иако не баш тачно, видите да се друга реч појављује упола толико пута колико прва, а трећа трећина.

Иста ствар се дешава и на шпанском. Ако узмемо за пример овај исти чланак, можемо видети да се реч „од“ користи 85 пута, тј највише се користи, док се реч „ла“, која је друга по употреби, може избројати до 57 пута.

Видећи да се овај феномен јавља у другим језицима, постаје занимљиво размишљати о томе како људски мозак обрађује језик. Иако постоје многи културни феномени који су мерили употребу и значење многих речи, језик о коме је реч је а културни фактор сам по себи, начин на који користимо најчешће коришћене речи чини се независним фактором културе.

  • Можда ћете бити заинтересовани: "Шта је културна психологија?"

Учесталост функцијских речи

Погледајмо следећих десет речи: „шта“, „од“, „не“, „до“, „оно“, „оно“, „јесте“, „и“, „у“ и „шта“. шта је свима заједничко? Што су саме по себи бесмислене речи, али иронично су 10 најчешће коришћених речи у шпанском језику.

Говорећи да им недостаје значење, подразумевамо да, ако се каже реченица у којој нема именице, придева, глагола или прилога, реченица је бесмислена. На пример:

… И …… у …… један… од …… до… од ……

С друге стране, ако тачке заменимо речима са значењем, можемо добити фразу попут следеће.

Мигуел и Ана код куће имају браон сто поред кревета.

Ове често коришћене речи су оно што су познате функционалне речи и Они су задужени за давање граматичке структуре реченици. То нису само десет које смо видели, заправо има их на десетине и све су међу сто најчешће коришћених речи на шпанском.

Иако су сами по себи бесмислени, је немогуће изоставити у било којој реченици коју желите да схватите. Неопходно је да се људи, да би ефикасно пренели поруку, прибегавају речима које чине структуру реченице. Из тог разлога су, необично, најчешће коришћени.

Истрага

Упркос ономе што је Џорџ Зипф приметио у својим студијама упоредне филозофије, до релативно недавно није било могуће емпиријски се позабавити постулатима закона. Не зато што је било материјално немогуће анализирати све разговоре или текстове на енглеском или било ком другом језику, већ због застрашујућег задатка и великог напора.

Срећом, и захваљујући постојању модерног рачунарства и софтвера, то је и било Могуће је истражити да ли је овај закон дат на начин на који га је Зипф предложио у почетку или је постојао варијације.

Један случај је истраживање које је спровео Центар за математичка истраживања (ЦРМ, у каталонском Центру де Рецерца Математица) повезан са Аутономним универзитетом у Барселони. Истраживачи Алваро Цоррал, Исабел Морено Гарциа и Францесц Фонт Цлос извели су свеобухватну анализу скали у којој су анализирали хиљаде дигитализованих текстова на енглеском да би видели колико је истинит Зипфов закон.

Његов рад, у којем је анализиран опсежни корпус од око 30 000 томова, омогућио му је да добије закон еквивалентан Зипфовом, у којој се видело да се најчешће употребљавана реч користи двоструко више од друге итд.

Зипф закон у другим контекстима

Иако се Зипфов закон првобитно користио за објашњавање учесталости речи које се користе у сваком језику, упоређујући његов опсег појављивања са стварном учесталошћу у текстовима и разговорима, такође је екстраполиран на друге ситуацијама.

Прилично упечатљив случај је број људи који живе у главним градовима САД. Према Зипфовом закону, најмногољуднији главни град Америке имао је двоструко већу величину од другог, а три пута већи од трећег по броју становника.

Ако погледате попис становништва из 2010. године, ово се слаже. Њујорк је имао укупно 8.175.133 становника, а следећи најмногољуднији главни град био је Лос Анђелес са 3.792.621 и следећи главни градови на ранг листи, Чикаго, Хјустон и Филаделфија са 2.695.598, 2.100.263 и 1.526.006, редом

То се може видети и у случају најнасељенијих градова Шпаније, иако Зипфов закон не важи. Потпуно је у складу, али у већој или мањој мери одговара рангу који сваки град заузима у рангирање. Мадрид са 3.266.126 становника има двоструко више од Барселоне, са 1.636.762, док Валенсија има око трећину са 800.000 становника.

Још један уочљив случај Зипфовог закона је са веб страницама. Сајбер простор је врло опсежан, са скоро 15 милијарди веб страница створених. Узимајући у обзир да у свету живи око 6.800 милиона људи, у теорији би за сваког од њих постојале две веб странице које би свакодневно посећивали, што није случај.

Тренутно је десет најпосећенијих страница: Гоогле (60,49 милиона посета месечно), Иоутубе (24,31 милиона), Фацебоок (19,98 милиона), Баиду (9,77 милиона), Википедиа (4,69 милиона), Твиттер (3,92 милиона), Иахоо (3,74 милиона), Порнхуб (3,36 милиона), Инстаграм (3,21 милиона) и Ксвидеос (3, 19 милиона). Гледајући ове бројке, можете видети да је Гоогле двоструко посећенији од ИоуТубе-а, три пута више од Фацебоок-а, више од четири пута више од Баидуа ...

Библиографске референце:

  • Фонт-Клос, Ф., Боледа, Г. и Цоррал, А. (2013) Закон о скалирању изван Зипфовог закона и његовог односа са Хепсовим законом. Нови часопис за физику, 15. дои.орг/10.1088/1367-2630/15/9/093033.
  • Монтемурро, М. ДО. (2001). Изван Зипф - Манделбротовог закона у квантитативној лингвистици. Пхисица А: Статистичка механика и њене примене 300: 567-578.

Језички ресурси: карактеристике, примери и врсте

Језички ресурси су неке од компоненти које чине дискурс. То су процедуре и елементи које користим...

Опширније

Натурализам: шта је то и које су његове карактеристике

Године 1867. роман је угледао светлост у Француској Тхересе Ракуин, који је написао Емил Зола (18...

Опширније

Главне разлике између раста и економског развоја

Није прошло много година откако смо изашли из последње велике економске кризе, кризе евра 2008. г...

Опширније