Education, study and knowledge

החוק של זיפף: תופעה חברתית ומתמטית מוזרה

אנו משתמשים באלפי מילים מדי יום, עם משמעויות מכל הסוגים ושייכות לקטגוריות דקדוק מגוונות מאוד. עם זאת, לא בכולם משתמשים באותה תדירות. תלוי כמה הם חשובים למבנה המשפט, יש מילים שחוזרות על עצמן יותר מאחרות.

החוק של זיף הוא פוסטול שמתייחס לתופעה זו ומציין עד כמה הסבירות שתשתמש במילה על סמך מיקומה בדירוג כל המילים המשמשות בשפה. בהמשך נפרט יותר על חוק זה.

  • מאמר קשור: "12 סוגי השפות (ומאפייניהם)"

החוק של זיפף

ג'ורג 'קינגסלי זיפף (1902–1950) היה בלשן אמריקאי, יליד פריפורט, אילינוי, שנתקל בתופעה מוזרה במחקריו על פילולוגיה השוואתית. בעבודתו, בה ערך ניתוח סטטיסטי, הוא מצא זאת נראה שהמילים הנפוצות ביותר היו בעלות דפוס מראה, זוהי לידתו של החוק המקבל את שם משפחתו.

על פי חוק זיף, ברוב המכריע של הזמן, אם לא תמיד, המילים המשמשות בטקסט כתוב או בשיחה בעל פה יבואו לפי הדפוס הבא: המילה הנפוצה ביותר שתתפוס את המיקום הראשון בדירוג, תשתמש בתדירות כפולה מ- השנייה בשימוש, פי שלוש מהשלישית, פי ארבע מהרביעי וכן הלאה ברצף.

במונחים מתמטיים, חוק זה יהיה:

Pn ≈ 1⁄na

כאשר 'Pn' הוא תדירות המילה בסדר 'n' והמערך 'a' הוא בערך 1.

צריך לומר את זה

instagram story viewer
ג'ורג 'זיף לא היה היחיד שצפה בקביעות זו בתדירות המילים הנפוצות ביותר של שפות רבות, טבעיות ומלאכותיות. למעשה ידועים שאחרים היו כאלה, כמו הסטגנוגרף ז'אן בפטיסט אסטופ והפיזיקאי פליקס אורבך.

זיפ למד את התופעה הזו עם טקסטים באנגלית, וכנראה שהיא נכונה. אם ניקח את הגרסה המקורית של מקור המינים מאת צ'רלס דרווין (1859) אנו רואים שהמילה הנפוצה ביותר בפרק הראשון היא "ה", עם הופעה של בערך 1,050, בעוד שהשני הוא "ו-", מופיע בערך 400 פעמים, והשלישי מופיע "to" בערך 300. אם כי לא בדיוק, אתה יכול לראות שהמילה השנייה מופיעה פי חצי מהשליש הראשון והשלישי.

אותו דבר קורה בספרדית. אם ניקח את אותו מאמר כדוגמא, אנו יכולים לראות כי המילה "of" משמשת 85 פעמים, להיות את הנפוץ ביותר, ואילו את המילה "la", שהיא השנייה בשימוש ביותר, ניתן למנות עד 57 פִּי.

כשרואים שתופעה זו מתרחשת בשפות אחרות, נהיה מעניין לחשוב כיצד המוח האנושי מעבד את השפה. למרות שישנן תופעות תרבותיות רבות שמדדו את השימוש והמשמעות של מילים רבות, השפה המדוברת היא א גורם תרבותי כשלעצמו, הדרך בה אנו משתמשים במילים הנפוצות ביותר נראית גורם בלתי תלוי ב- תַרְבּוּת.

  • יכול להיות שאתה מעוניין: "מהי פסיכולוגיה תרבותית?"

תדירות מילות הפונקציה

בואו נסתכל על עשר המילים הבאות: 'מה', 'מ', 'לא', 'אל', 'את', 'את', 'זה', 'ו', 'ב' ו'מה '. מה משותף לכולם? שהן מילים חסרות משמעות בפני עצמן אך באופן אירוני הן עשר המילים הנפוצות ביותר בשפה הספרדית.

באמירתם שאין להם משמעות, אנו מתכוונים שאם נאמר משפט בו אין שם עצם, שם תואר, פועל או כינוי, המשפט חסר משמעות. לדוגמה:

... ו ...… ב... ... אחד... של …… עד… של ……

מצד שני, אם נחליף את הנקודות במילים במשמעות, נוכל לקבל ביטוי כמו הבא.

למיגל ולאנה יש שולחן חום ליד מיטתם בבית.

מילים נפוצות אלו הן מילות פונקציה ידועות ו הם אחראים על מתן מבנה דקדוקי למשפט. הם לא רק 10 שראינו, למעשה יש עשרות כאלה, וכולם נמנים עם מאה המילים הנפוצות ביותר בספרדית.

למרות שהם חסרי משמעות בפני עצמם, אי אפשר להשמיט בשום משפט שרוצים להבין בו. יש צורך שבני אדם, כדי להעביר מסר ביעילות, נשתמש במילים המהוות את מבנה המשפט. מסיבה זו הם, באופן מוזר, הנפוצים ביותר.

חֲקִירָה

למרות מה שציין ג'ורג 'זיף במחקריו על פילוסופיה השוואתית, עד לאחרונה יחסית לא ניתן היה להתייחס באופן אמפירי לתחומי החוק. לא בגלל שאי אפשר היה לנתח את כל השיחות או הטקסטים באנגלית או כל שפה אחרת מבחינה חומרית, אלא בגלל המשימה המרתיעה והמאמץ הרב הכרוך בכך.

למרבה המזל, ובזכות קיומם של מחשוב ותוכנה מודרניים זה היה ניתן לחקור אם החוק הזה ניתן באופן שבו הציע אותו Zipf בהתחלה או שהיה וריאציות.

מקרה אחד הוא המחקר שבוצע על ידי המרכז למחקר מתמטי (CRM, במרכז הקטלאני דה ריצ'רה מטמטיקה) המקושר לאוניברסיטה האוטונומית של ברצלונה. החוקרים אלווארו קורל, איזבל מורנו גרסיה ופרנצ'סק פונט קלוס ביצעו ניתוח מקיף בקנה מידה שבו הם ניתחו אלפי טקסטים דיגיטציה באנגלית כדי לראות עד כמה החוק של זיף נכון.

עבודתו, בה נותח קורפוס נרחב של כ- 30,000 כרכים, אפשרה לו להשיג חוק המקביל לזה של ציפף., בו נראה כי המילה הנפוצה ביותר הייתה בשימוש כפול מהשנייה וכו '.

חוק Zipf בהקשרים אחרים

למרות שחוק ציפף שימש במקור להסבר תדירות המילים המשמשות בכל שפה, בהשוואת טווח הופעתו לתדירותו האמיתית בטקסטים ובשיחות, הוא הוחזר גם לאחרים מצבים.

מקרה די בולט הוא מספר האנשים החיים בבירות ארה"ב. על פי חוק זיף, הבירה האמריקאית המאוכלסת ביותר הייתה בגודל כפול מהגודל השני באוכלוסייה, וגודל פי שלושה מגודלה של האוכלוסייה השלישית.

אם מסתכלים על מפקד האוכלוסין ב -2010, זה מסכים. בניו יורק היו אוכלוסייה כוללת של 8,175,133 אנשים, כאשר הבירה המאוכלסת הבאה הייתה לוס אנג'לס 3,792,621 והבירות הבאות בדירוג, שיקגו, יוסטון ופילדלפיה עם 2,695,598, 2,100,263 ו -1,526,006, בהתאמה

ניתן לראות זאת גם במקרה של הערים המאוכלסות ביותר בספרד, אם כי חוק ציפף אינו חל. היא תואמת לחלוטין, אך היא תואמת, במידה פחות או יותר, את הדרגה שכל עיר תופסת בה דירוג. במדריד, עם אוכלוסייה של 3,266,126, יש כפליים מאלה של ברצלונה, עם 1,636,762, ואילו ולנסיה מונה כשליש עם 800,000 תושבים.

מקרה נצפה נוסף של חוק זיף הוא בדפי אינטרנט. מרחב הסייבר הוא נרחב מאוד, עם כ -15,000 מיליון דפי אינטרנט שנוצרו. אם ניקח בחשבון שבעולם ישנם כ -6,800 מיליון אנשים, תיאורטית עבור כל אחד מהם יהיו שני דפי רשת לבקר בהם מדי יום, וזה לא המקרה.

עשרת הדפים המתוירים ביותר כיום הם: גוגל (60.49 מיליון ביקורים חודשיים), Youtube (24.31 מיליון), פייסבוק (19.98 מיליון), באידו (9.77 מיליון), ויקיפדיה (4.69 מיליון), טוויטר (3.92 מיליון), יאהו (3.74 מיליון), Pornhub (3.36 מיליון), אינסטגרם (3.21 מיליון) ו- Xvideos (3, 19 מיליונים). כשמסתכלים על המספרים האלה, אתה יכול לראות שגוגל ביקרו פי שניים מיוטיוב, פי שלושה מאשר פייסבוק, יותר מארבע פעמים מביידו ...

הפניות ביבליוגרפיות:

  • פונט-קלוס, פ., בולדה, ג. ו- Corral, Á. (2013) חוק קנה מידה מעבר לחוק Zipf ויחסו לחוק Heaps. כתב העת החדש לפיזיקה, 15. doi.org/10.1088/1367-2630/15/9/093033.
  • מונטמוררו, מ. ל. (2001). מעבר ל Zipf - חוק מנדלברוט בבלשנות כמותית. פיזיקה א ': מכניקה סטטיסטית ויישומיה 300: 567-578.
6 המנהגים והמסורות החשובים ביותר של אראגון

6 המנהגים והמסורות החשובים ביותר של אראגון

אראגון היא קהילה אוטונומית הבולטת במסורות שלה ובמגוון התרבותי שלה. בו מדברים זנים לשוניים שונים ה...

קרא עוד

9 המנהגים והמסורות החשובים ביותר של צ'ילה

9 המנהגים והמסורות החשובים ביותר של צ'ילה

צ'ילה היא מדינה השוכנת בדרום הקיצוני של דרום אמריקה, ששמה הרשמי הוא הרפובליקה של צ'ילה לאחר שאימצ...

קרא עוד

20 מיתוסים על בעלי חיים (שקריים)

20 מיתוסים על בעלי חיים (שקריים)

לפעמים אנו בני האדם שוכחים שאנו חולקים את כדור הארץ עם יצורים חיים אחרים. חקר עולם החי מגלה מאפיי...

קרא עוד