Education, study and knowledge

Zipfs Gesetz: ein merkwürdiges soziales und mathematisches Phänomen

Wir verwenden täglich Tausende von Wörtern, die alle möglichen Bedeutungen haben und sehr unterschiedlichen grammatikalischen Kategorien angehören. Allerdings werden nicht alle mit der gleichen Häufigkeit verwendet. Je nachdem, wie wichtig sie für die Struktur des Satzes sind, gibt es Wörter, die häufiger vorkommen als andere.

Das Zipfsche Gesetz ist ein Postulat, das diesem Phänomen Rechnung trägt und gibt an, wie wahrscheinlich ein Wort verwendet wird, basierend auf seiner Position in der Rangfolge aller in einer Sprache verwendeten Wörter. Als nächstes gehen wir näher auf dieses Gesetz ein.

  • Verwandter Artikel: "Die 12 Sprachtypen (und ihre Eigenschaften)"

Zipfs Gesetz

George Kingsley Zipf (1902–1950) war ein US-amerikanischer Linguist, der in Freeport, Illinois, geboren wurde und in seinem Studium der vergleichenden Philologie auf ein merkwürdiges Phänomen stieß. In seiner Arbeit, in der er statistische Analysen durchführte, stellte er fest, dass die am häufigsten verwendeten Wörter schienen ein Erscheinungsmuster zu haben

instagram story viewer
, dies ist die Geburt des Gesetzes, das seinen Nachnamen erhält.

Nach dem Zipfschen Gesetz wird in der überwiegenden Mehrheit der Zeit, wenn nicht immer, die Wörter, die in einem schriftlichen Text oder in einem mündlichen Gespräch verwendet werden, folgen dem folgenden Muster:: das am häufigsten verwendete Wort, das den ersten Platz im Ranking belegen würde, würde doppelt so oft verwendet wie die zweithäufigste, dreimal so oft wie die dritte, viermal so oft wie die vierte und so weiter nacheinander.

Mathematisch wäre dieses Gesetz:

Pn ≈ 1⁄na

Wobei 'Pn' die Häufigkeit eines Wortes in der Reihenfolge 'n' ist und der Exponent 'a' ungefähr 1 ist.

Das sollte man sagen George Zipf war nicht der einzige, der diese Regelmäßigkeit in der Häufigkeit der am häufigsten verwendeten Wörter beobachtete vieler Sprachen, natürlicher und künstlicher. Tatsächlich ist bekannt, dass es auch andere gab, wie den Steganografen Jean-Baptiste Estoup und den Physiker Felix Auerbach.

Zipf hat dieses Phänomen mit englischsprachigen Texten untersucht und anscheinend stimmt es. Wenn wir die Originalversion von nehmen Der Ursprung der Arten von Charles Darwin (1859) sehen wir, dass das am häufigsten verwendete Wort im ersten Kapitel "der" ist, mit einem Vorkommen von ungefähr 1.050, während das zweite "und" ist, das etwa 400-mal vorkommt, und das dritte "zu" ist, das erscheint etwa 300. Obwohl nicht genau, können Sie sehen, dass das zweite Wort halb so oft vorkommt wie das erste und das dritte ein Drittel.

Das gleiche passiert auf Spanisch. Wenn wir denselben Artikel als Beispiel nehmen, können wir sehen, dass das Wort "von" 85 Mal verwendet wird, d das am häufigsten verwendete Wort, während das Wort "la", das am zweithäufigsten verwendet wird, bis zu 57 gezählt werden kann mal.

Da dieses Phänomen auch in anderen Sprachen auftritt, wird es interessant, darüber nachzudenken, wie das menschliche Gehirn Sprache verarbeitet. Obwohl es viele kulturelle Phänomene gibt, die den Gebrauch und die Bedeutung vieler Wörter gemessen haben, handelt es sich bei der fraglichen Sprache um eine kultureller Faktor an sich, die Art und Weise, wie wir die am häufigsten verwendeten Wörter verwenden, scheint ein unabhängiger Faktor zu sein Kultur.

  • Das könnte Sie interessieren: "Was ist Kulturpsychologie?"

Häufigkeit von Funktionswörtern

Schauen wir uns die folgenden zehn Wörter an: ‚was‘, ‚von‘, ‚nicht‘, ‚bis‘, ‚das‘, ‚das‘, ‚ist‘, ‚und‘, ‚in‘ und ‚was‘. was haben sie alle gemeinsam? Was für sich genommen bedeutungslose Worte sind, aber ironischerweise sind die 10 am häufigsten verwendeten Wörter in der spanischen Sprache.

Wenn wir sagen, dass es ihnen an Bedeutung mangelt, meinen wir, dass der Satz bedeutungslos ist, wenn ein Satz gesagt wird, in dem es kein Nomen, Adjektiv, Verb oder Adverb gibt. Beispielsweise:

… Und…… in…… einem… von…… bis… von……

Auf der anderen Seite, wenn wir die Punkte durch Wörter mit Bedeutung ersetzen, können wir einen Satz wie den folgenden haben.

Miguel und Ana haben zu Hause einen braunen Tisch neben ihrem Bett.

Diese häufig verwendeten Wörter sind sogenannte Funktionswörter, und Sie sind dafür verantwortlich, dem Satz eine grammatikalische Struktur zu geben. Es sind nicht nur die 10, die wir gesehen haben, es gibt Dutzende von ihnen, und alle gehören zu den hundert am häufigsten verwendeten Wörtern im Spanischen.

Obwohl sie für sich genommen bedeutungslos sind, sind in keinem Satz wegzulassen, den Sie verstehen möchten. Es ist notwendig, dass Menschen, um eine Nachricht effizient zu übermitteln, auf Wörter zurückgreifen, die die Struktur des Satzes bilden. Aus diesem Grund werden sie merkwürdigerweise am häufigsten verwendet.

Ermittlung

Ungeachtet dessen, was George Zipf in seinem Studium der vergleichenden Philosophie beobachtete, bis vor kurzem war es nicht möglich, die Postulate des Rechts empirisch zu adressieren. Nicht weil es materiell unmöglich war, alle Gespräche oder Texte in Englisch oder einer anderen Sprache zu analysieren, sondern wegen der gewaltigen Aufgabe und des damit verbundenen großen Aufwands.

Glücklicherweise und dank der Existenz moderner Computer und Software war es Es ist möglich zu untersuchen, ob dieses Gesetz so gegeben wurde, wie Zipf es ursprünglich vorgeschlagen hat, oder ob es solche gab Variationen.

Ein Fall ist die Forschung des Zentrums für mathematische Forschung (CRM, im katalanischen Centre de Recerca Matemàtica), das mit der Autonomen Universität Barcelona verbunden ist. Die Forscher Álvaro Corral, Isabel Moreno García und Francesc Font Clos führten eine umfassende Analyse durch Skala, in der sie Tausende von digitalisierten Texten in englischer Sprache analysierten, um zu sehen, wie wahr Zipfs Gesetz war.

Seine Arbeit, in der ein umfangreicher Korpus von etwa 30.000 Bänden analysiert wurde, ermöglichte es ihm, ein Gesetz zu erhalten, das dem von Zipf. entspricht, in dem festgestellt wurde, dass das am häufigsten verwendete Wort doppelt so häufig verwendet wurde wie das zweite, und so weiter.

Das Zipf-Gesetz in anderen Zusammenhängen

Obwohl das Zipfsche Gesetz ursprünglich verwendet wurde, um die Häufigkeit von Wörtern zu erklären, die in jeder Sprache verwendet werden, vergleicht seine Erscheinungsbreite mit seiner tatsächlichen Häufigkeit in Texten und Gesprächen und wurde auch auf andere hochgerechnet Situationen.

Ein ziemlich auffälliger Fall ist die Zahl der Menschen, die in US-Hauptstädten leben. Nach Zipfs Gesetz war die bevölkerungsreichste amerikanische Hauptstadt doppelt so groß wie die zweitbevölkerungsreichste und dreimal so groß wie die drittgrößte.

Wenn man sich die Volkszählung von 2010 anschaut, stimmt das. New York hatte eine Gesamtbevölkerung von 8.175.133 Menschen, wobei die nächstgrößte Hauptstadt Los Angeles war, mit 3.792.621 und die folgenden Hauptstädte im Ranking, Chicago, Houston und Philadelphia mit 2.695.598, 2.100.263 und 1.526.006, beziehungsweise

Dies zeigt sich auch bei den bevölkerungsreichsten Städten Spaniens, wobei das Gesetz von Zipf nicht gilt. Es ist vollständig konform, entspricht jedoch mehr oder weniger dem Rang, den jede Stadt in der Rangfolge. Madrid mit 3.266.126 Einwohnern hat das Doppelte von Barcelona mit 1.636.762 Einwohnern, während Valencia mit 800.000 Einwohnern etwa ein Drittel hat.

Ein weiterer beobachtbarer Fall des Zipfschen Gesetzes sind Webseiten. Der Cyberspace ist mit fast 15 Milliarden erstellten Webseiten sehr umfangreich. Wenn man bedenkt, dass es weltweit etwa 6.800 Millionen Menschen gibt, müssten theoretisch für jeden von ihnen täglich zwei Webseiten besucht werden, was nicht der Fall ist.

Die derzeit zehn meistbesuchten Seiten sind: Google (60,49 Millionen monatliche Besuche), Youtube (24,31 Millionen), Facebook (19,98 Millionen), Baidu (9,77 Millionen), Wikipedia (4,69 Millionen), Twitter (3,92 Millionen), Yahoo (3,74 Millionen), Pornhub (3,36 Millionen), Instagram (3,21 Millionen) und Xvideos (3, 19 .). Millionen). Wenn man sich diese Zahlen ansieht, sieht man, dass Google doppelt so oft besucht wird wie YouTube, dreimal so oft wie Facebook, mehr als viermal so viel wie Baidu ...

Bibliographische Referenzen:

  • Font-Clos, F., Boleda, G. und Corral, (2013) Ein Skalierungsgesetz jenseits des Zipfschen Gesetzes und seiner Beziehung zum Heaps-Gesetz. Neue Zeitschrift für Physik, 15. doi.org/10.1088/1367-2630/15/9/093033.
  • Montemurro, M. ZU. (2001). Jenseits des Zipf-Mandelbrot-Gesetzes in der quantitativen Linguistik. Physica A: Statistische Mechanik und ihre Anwendungen 300: 567-578.
Die 35 Papiersorten (und ihre Eigenschaften)

Die 35 Papiersorten (und ihre Eigenschaften)

Wussten Sie, dass Papier eines der am häufigsten von den Menschen auf der Welt verwendeten Gegens...

Weiterlesen

Die 17 Diagrammtypen (und ihre Eigenschaften)

Die 17 Diagrammtypen (und ihre Eigenschaften)

Viele von uns haben tatsächlich wenig Verständnis für bestimmte organisierte Daten, die alle wiss...

Weiterlesen

Die 7 besten Bücher, um Mädchen zu stärken (und die du auch lesen kannst)

Die 7 besten Bücher, um Mädchen zu stärken (und die du auch lesen kannst)

Malala Yousafzai, die pakistanische Aktivistin, sagte es mit diesem poetischen Satz: "Es gibt nur...

Weiterlesen