Иванов-Петров Александр (ivanov_petrov) wrote,
Иванов-Петров Александр
ivanov_petrov

http://gtmarket.ru/news/culture/2007/10/19/1433
<<<Обнаружены общие закономерности лингвистической и биологической эволюции
В журнале Nature опубликованы сразу две статьи, посвященные изучению темпов лингвистической эволюции в зависимости от частоты словоупотребления. Ведущие авторы обеих статей — биологи. С результатами обоих исследований можно ознакомиться в последнем выпуске журнала.

Экстраполируя свои результаты в будущее, авторы предсказывают, что, если выявленные тенденции сохранятся, к 2500 году еще 15 глаголов из исследованной выборки станут правильными, причем первым скорее всего «регуляризуется» самый редкий из них (to Wed «сочетаться браком»). Строго говоря, он уже отчасти регуляризован: словари разрешают спрягать его также и как правильный глагол (наряду с «неправильной» формой прошедшего времени — Wed, в словарях приводится «правильная» — Wedded).

Соавтор исследования Эрез Либерман (Erez Lieberman), аспирант по прикладной математике из Гарвардского университета, говорит: «Будучи часто употребляемым, глагол становится более устойчивым. В языке действует такое же правило естественного отбора, что и в биологической эволюции». Автор книги «Математическая природа языка», профессор математики и статистики Чикагского университета Парта Нийоджи (Partha Niyogi) так комментирует исследование: «Биологические модели развития совместимы с лингвистическими. Языки постоянно изменяются, как и биологические виды».

***
Слова из разных языков, обозначающие одно и то же понятие и являющиеся потомками одного и того же слова, объединялись в «родственные группы». Например, слово, выражающее значение «два» во всех индоевропейских языках относится к одной и той же родственной группе (англ. two, нем. zwei, исп. dos, фр. deux, русск. два, и так далее), тогда как, например, значение «хвост» представлено в исследованных 87 языках 28 группами (греч. ????, нем. Schwanz, фр. Queue, англ. Tail — примеры слов, относящихся к разным группам). Общее число родственных групп для 200 значений в 87 языках оказалось равным 4049.

Для каждого из 200 понятий была определена частота встречаемости. С этой целью авторы проанализировали большой массив данных по устной и письменной речи для четырех языков: английского, испанского, русского и греческого (от 20 до 100 млн. слов для каждого языка). Эти языки представляют далекие друг от друга ветви индоевропейской семьи. Выяснилось, что частота употребления различных понятий в четырех языках весьма сходна, иначе говоря, понятия, часто употребляемые в одном из языков, скорее всего и в других языках употребляются часто, и наоборот.

Следующим шагом было построение эволюционного древа 87 индоевропейских языков. Основой для построения древа послужила таблица из 87 X 4049 нулей и единиц, отражающая наличие или отсутствие каждой из 4049 словесных групп в каждом из 87 языков. При этом были использованы сложные математические методики построения эволюционных деревьев, разработанные биологами-эволюционистами.

...Затем авторы построили графики зависимости скорости словоизменения от частоты словоупотребления в английском, русском, испанском и греческом языках (см. рис). Оказалось, что для каждой части речи в отдельности и для всех понятий в целом между этими двумя показателями наблюдается хорошо выраженная обратная зависимость. Чем чаще употребляется слово, тем медленнее оно изменяется.

По мнению авторов, эта зависимость может объясняться двумя причинами:

1. Люди реже ошибаются при произнесении, запоминании и восприятии на слух часто употребляемых слов. Это предположение подтверждается эмпирическими данными.
2. Люди (популяция носителей языка) реже соглашаются принять новшество, если речь идет о часто употребляемом слове.

Вполне возможно, что работают одновременно оба механизма. Заметно, что они полностью аналогичны ключевым факторам биологической эволюции, а именно скорости мутирования и эффективности стабилизирующего («очищающего») отбора. Авторы предполагают, что «мутации» в наиболее важных словах чаще отсекаются «отбором», потому что такие мутации ведут к наибольшему риску взаимного непонимания. Возможно, именно поэтому из всех частей речи медленнее всего изменяются как раз те, «мутации» в которых почти всегда ведут к полной потере или искажению смысла фразы (числительные, местоимения и «специальные наречия»).

Обнаруженная закономерность, скорее всего, справедлива и для других языковых семей. Например, теми же авторами в 2006 году было показано, что понятия, характеризующиеся высокой частотой словоизменения в индоевропейских языках, обладают тем же свойством и в языках банту.''

Авторы отмечают, что найденная закономерность позволяет сделать любопытные прогнозы. Во-первых, можно ожидать, что при расхождении двух языков, имеющих общего «предка», различия будут накапливаться сначала в менее важных словах, и поэтому два языка будут оставаться взаимно понятными намного дольше, чем следовало бы ожидать, исходя из предположения о случайном распределении возникающих изменений по всему лексикону. Во-вторых, исследование показало, что часто употребляемые слова могут сохраняться в узнаваемом виде 10 000 лет и более; это значит, что в культурной эволюции возможны «репликаторы» — мемы, почти сопоставимые по надежности своей репликации (передачи, воспроизведения) с некоторыми генами.
http://www.nature.com/nature/journal/v449/n7163/extref/nature06176-s1.pdf

Сравнение лингвистической эволюции с биологической встречалось ранее во многих работах (например, A. Wedel. Exemplar Models, Evolution and Language Change // The Linguistic Review. 2006. V. 23. P. 247–274 http://dingo.sbs.arizona.edu/~wedel/publications/PDF/WedelExEvLangChange.pdf) и, несомненно, имеет право на существование, однако проводить аналогию между словами и живыми особями, языками и биологическими видами следует с известной осторожностью. Механизмы возникновения, развития и исчезновения биологических и лингвистических объектов все же достаточно разные. Тем не менее есть основания полагать (и рассмотренные работы это подтверждают), что некоторые общие механизмы обоих типов эволюции могут описываться одними и теми же методами, что, разумеется, чрезвычайно интересно и с практической, и с теоретической точки зрения.

http://www.nature.com/nature/journal/v449/n7163/abs/nature06137.html
http://www.nature.com/nature/journal/v449/n7163/abs/nature06176.html
Tags: language2
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 42 comments