Education, study and knowledge

Закон Ципфа: любопытный социально-математический феномен

click fraud protection

Мы используем тысячи слов каждый день со значениями всех видов и принадлежащих к самым разным грамматическим категориям. Однако не все они используются с одинаковой частотой. В зависимости от того, насколько они важны для структуры предложения, есть слова, которые повторяются чаще, чем другие.

Закон Ципфа - это постулат, учитывающий это явление. и определяет, насколько вероятно слово будет использоваться в зависимости от его позиции в рейтинге всех слов, используемых в языке. Далее мы более подробно остановимся на этом законе.

  • Статья по теме: "12 типов языка (и их характеристики)"

Закон Ципфа

Джордж Кингсли Зипф (1902–1950) был американским лингвистом, родившимся во Фрипорте, штат Иллинойс, который столкнулся с любопытным явлением в своих исследованиях сравнительной филологии. В своей работе, в которой он проводил статистический анализ, он обнаружил, что наиболее часто используемые слова, казалось, имели образец внешнего вида, так родился закон, получивший его фамилию.

Согласно закону Ципфа, в подавляющем большинстве случаев, если не всегда,

instagram story viewer
слова, которые используются в письменном тексте или в устной беседе, будут следовать следующей схеме: наиболее употребляемое слово, занимающее первую позицию в рейтинге, будет использоваться в два раза чаще, чем второй по популярности, в три раза больше третьего, в четыре раза больше четвертого и т. д. последовательно.

С математической точки зрения этот закон будет выглядеть так:

Pn ≈ 1⁄na

Где «Pn» - частота слова в порядке «n», а показатель степени «a» приблизительно равен 1.

Следует сказать, что Джордж Зипф был не единственным, кто заметил эту закономерность в частотности наиболее употребляемых слов. многих языков, как естественных, так и искусственных. На самом деле известно, что были и другие, такие как стеганограф Жан-Батист Эступ и физик Феликс Ауэрбах.

Ципф изучал это явление с текстами на английском языке, и, судя по всему, это правда. Если взять исходную версию Происхождение видов Чарльза Дарвина (1859 г.) мы видим, что наиболее часто используемым словом в первой главе является «the», с появлением примерно 1050, в то время как второй - это «и», встречается около 400 раз, а третий - «до», встречается около 300. Хотя это не совсем так, вы можете видеть, что второе слово встречается в два раза чаще, чем первое, а третье - на треть.

То же самое происходит на испанском. Если мы возьмем эту же статью в качестве примера, то увидим, что слово «of» используется 85 раз, т.е. наиболее часто употребляемых, а слово "ла", которое занимает второе место по употреблению, может насчитывать до 57 раз.

Видя, что это явление происходит в других языках, становится интересно подумать о том, как человеческий мозг обрабатывает язык. Хотя существует множество культурных явлений, которые измеряют использование и значение многих слов, рассматриваемый язык является культурный фактор сам по себе, то, как мы используем наиболее часто используемые слова, кажется независимым фактором культура.

  • Вам может быть интересно: "Что такое культурная психология?"

Частота служебных слов

Давайте посмотрим на следующие десять слов: «what», «from», «not», «to», «the», «the», «is», «and», «in» и «what». Что у них общего? Это бессмысленные слова сами по себе, но по иронии судьбы 10 самых употребляемых слов в испанском языке.

Говоря, что они лишены смысла, мы имеем в виду, что если сказано предложение, в котором нет существительного, прилагательного, глагола или наречия, предложение не имеет смысла. Например:

… И …… в …… одном… из …… в… из ……

С другой стороны, если мы заменим точки словами со значением, у нас может получиться фраза, подобная следующей.

У Мигеля и Аны дома есть коричневый столик рядом с их кроватью.

Эти часто используемые слова являются известными функциональными словами, и отвечают за грамматическую структуру предложения. Это не только 10, которые мы видели, на самом деле их десятки, и все они входят в сотню наиболее употребляемых слов в испанском языке.

Хотя сами по себе они бессмысленны, невозможно опустить ни в одном предложении, которое вы хотите понять. Необходимо, чтобы люди, чтобы эффективно передавать сообщение, прибегали к словам, составляющим структуру предложения. По этой причине они, как ни странно, наиболее часто используются.

Расследование

Несмотря на то, что Джордж Зипф наблюдал в своих исследованиях сравнительной философии, до недавнего времени было невозможно эмпирически рассмотреть постулаты закона.. Не потому, что было материально невозможно проанализировать все разговоры или тексты на английском или любом другом языке, а из-за титанической задачи и огромных усилий, которые она требовала.

К счастью, благодаря наличию современных компьютеров и программного обеспечения, это удалось. Можно исследовать, был ли этот закон дан в том виде, в каком он был предложен Ципфом вначале, или же были вариации.

Одним из примеров является исследование, проведенное Центром математических исследований (CRM, в Каталонском центре Recerca Matemàtica), связанным с Автономным университетом Барселоны. Исследователи Альваро Корраль, Изабель Морено Гарсия и Франческ Фонт Клос провели всесторонний анализ. шкала, в которой они проанализировали тысячи оцифрованных текстов на английском языке, чтобы увидеть, насколько верен закон Ципфа.

Его работа, в которой был проанализирован обширный корпус из около 30 000 томов, позволила ему получить закон, эквивалентный закону Ципфа., в котором было замечено, что наиболее употребляемое слово было в два раза больше, чем второе, и так далее.

Закон Ципфа в других контекстах

Хотя закон Ципфа изначально использовался для объяснения частоты употребления слов в каждом языке, сравнивая диапазон его появления с его реальной частотой в текстах и ​​разговорах, он также был экстраполирован на другие ситуации.

Довольно яркий случай: количество людей, живущих в столицах США. Согласно закону Ципфа, самая густонаселенная столица Америки была вдвое больше, чем вторая по численности населения, и в три раза больше, чем третья по численности населения.

Если вы посмотрите на перепись населения 2010 года, это согласуется. Общее население Нью-Йорка составляло 8 175 133 человека, следующей по численности населения столицей был Лос-Анджелес. 3,792,621 и следующие столицы в рейтинге: Чикаго, Хьюстон и Филадельфия с 2,695,598, 2,100,263 и 1,526,006, соответственно

Это также можно увидеть в случае самых густонаселенных городов Испании, хотя закон Ципфа не применяется. Он полностью соответствует требованиям, но в большей или меньшей степени соответствует тому рангу, который каждый город занимает в рейтинге. рейтинг. В Мадриде с населением 3 266 126 человек, что вдвое больше, чем в Барселоне (1 636 762 человека), а в Валенсии - примерно треть с 800 000 жителей.

Другой наблюдаемый пример закона Ципфа - веб-страницы.. Киберпространство очень обширно, в нем создано почти 15 миллиардов веб-страниц. Принимая во внимание, что в мире около 6800 миллионов человек, теоретически для каждого из них будет две веб-страницы, которые нужно посещать каждый день, что не так.

В десятку самых посещаемых страниц в настоящее время входят: Google (60,49 миллиона посещений в месяц), Youtube (24,31 миллиона), Facebook (19,98 миллиона), Baidu. (9,77 миллиона), Wikipedia (4,69 миллиона), Twitter (3,92 миллиона), Yahoo (3,74 миллиона), Pornhub (3,36 миллиона), Instagram (3,21 миллиона) и Xvideos (3, 19 миллионы). Глядя на эти цифры, вы можете увидеть, что Google посещают вдвое больше, чем YouTube, в три раза больше, чем Facebook, более чем в четыре раза больше, чем Baidu ...

Библиографические ссылки:

  • Фон-Клос, Ф., Боледа, Г. and Corral, A. (2013) Закон масштабирования, выходящий за рамки закона Ципфа, и его связь с законом Хипса. Новый журнал физики, 15. doi.org/10.1088/1367-2630/15/9/093033.
  • Монтемурро, М. К. (2001). За пределами закона Ципфа-Мандельброта в количественной лингвистике. Physica A: Статистическая механика и ее приложения 300: 567-578.
Teachs.ru
15 разделов истории: что они из себя представляют и что изучают

15 разделов истории: что они из себя представляют и что изучают

История – это наука, изучающая события, происходившие в прошлом. Хотя она изучает прошлое во всей...

Читать далее

Гуанчи: кто они и как жили?

До кастильского завоевания Канарских островов, еще в 15 веке, на архипелаге жила аборигенная куль...

Читать далее

Фовизм: что это такое и особенности этого художественного направления

Фовизм: что это такое и особенности этого художественного направления

18 октября 1905 года в Большом дворце на Елисейских полях в Париже открылся так называемый Осенни...

Читать далее

instagram viewer