Иванов-Петров Александр (ivanov_petrov) wrote,
Иванов-Петров Александр
ivanov_petrov

Categories:

Как создается единая классификация языков мира

Лекция Георгия Старостина
http://www.polit.ru/lectures/2011/01/03/starostin.html


<<<...сконцентрироваться в большей степени на методологическом аспекте нашей работы, работы компаративиста, так сказать, на кухне сравнительно-исторического языкознания, показать не столько к каким результатам мы пришли, хотя это тоже будет в какой-то степени, сколько - как, собственно, мы это делаем, что умеем, а чему еще предстоит научиться. Поэтому лекция называется «Как создается единая классификация языков мира», а не «Как выглядит единая классификация языков мира».

...«Этнолог» насчитывает ровным счетом 6909 языков, но это личное мнение «Этнолога», другие при желании могут насчитать их 2 тысячи, а могут насчитать 60 тысяч - в зависимости от того, как проводить границу между языком и диалектом.

...Эволюционная модель языкового развития - основная на сегодняшний день - предполагает, что основная причина языкового разнообразия в дивергенции в происхождении.

...Какие классификации существуют в современной лингвистике? Если проводить аналогию с биологическими науками, то, наверное, ближе всего к биологии классификации, которые стали разрабатываться относительно недавно на серьезном научном уровне. Во всяком случае, носители научного уровня - это типологические классификации, которые подразделяют языки на группы или типы в зависимости от того, как в них реализуется то или иное свойство человеческого языка вообще.

...Признаков таких существует огромное количество. Можно выбирать морфологические, грамматические признаки, состав грамматических категорий. В языке бывает число, падеж, время, наклонение и так далее. Бывают синтаксические критерии: порядок слов в предложении, способы образования сложных предложений и тому подобное.

Сейчас существует несколько глобальных типологических проектов, и из них самым известным (картинку с сайта я показываю) является так называемый World atlas of linguistic structures – мировой атлас лингвистических структур, который в Лейпциге в институте Макса Планка подготовил большой коллектив ученых под руководством Мартина Хаспельмата и Бернарда Комри.

Это огромная база данных, которая охватывает почти половину всех известных языков мира, и для каждого из них там отмечены лингвистические значения примерно по 140 признакам. Есть другой подход, который больший упор делает на количество признаков. В институте языкознания Академии Наук у нас создается база, которая называется «Языки мира», и там языков сильно меньше, примерно 400 языков охвачено, но зато по каждому языку отмечено порядка 4000 разных признаков.

Все эти типологические базы компьютеризированы, информация обрабатывается в них автоматически, и в результате, просчитав, обследовав большое количество признаков, можно на этом основании построить разные типологические деревья, точнее, обычно строят не деревья, а сети networks – это графы более сложной структуры без единой вершины, которые позволяют наглядно определить позицию одного элемента относительно всех остальных. Вот пример такой сети, построенной как раз по нескольким языкам Евразии и Африки на материале мирового атласа языковых структур.



...Если проводить более пристальный анализ, то оказывается, что внутри этих пучков проскальзывают какие-то связи, абсурдным образом устанавливаемые. Какую бы типологическую модель мы ни брали, она на 20-30% будет давать заведомо абсурдные результаты.

...С чем связана такая ситуация? Почему типологический анализ может давать и все время дает в определенных случаях неверные результаты? Дело в том, что мы не разграничиваем при построении такой модели два очень важных и разных механизма. Языковые изменения, как известно, в языке происходят, во-первых, в ходе так называемой вертикальной передачи, вертикальной трансмиссии от старшего поколения к младшему и, во-вторых, что очень важно, в ходе горизонтальной передачи – передачи элементов из одного языка в другой в ходе межъязыковых контактов. В отличие от биологической эволюции, где такая горизонтальная трансмиссия - вещь довольно редкая, в языке она совершенно естественна и происходит все время.

...Если языки имеют разное происхождение, но при этом исторический процесс забросил их носителей в один и тот же культурно-географический ареал, то они рано или поздно образуют так называемый языковой союз, и главная, первоочередная задача компаративиста (исторического лингвиста) - не спутать языковой союз с настоящей языковой семьей.

...Типологическая классификация всех этих глубоких тонкостей не чует, поэтому значимость ее для реконструкции исторического процесса на самом деле довольно низкая. Конечно, конкретные формы, слова тоже заимствуются и передаются не только вертикальным, но и горизонтальным образом - нередко в огромных количествах. Классические хрестоматийные примеры - это колоссальный процент китайской лексики в японском языке, например, или французской лексики в английском языке. Поэтому важно учитывать, что для классификации годятся далеко не любые слова, а только определенная категория слов, но об этом я скажу чуть позже.

...Типологическая классификация - в первую очередь методологическая; ее понятно, как строить, – отбираешь какое-то количество признаков (10, 20, 50, 100, 400) и по ним строишь типологическое дерево или типологическую сеть, как угодно ее можно назвать, но при этом совершенно непонятно, что реально отражает, какой исторический смысл лежит за этой классификацией, в каком случае она показывает историческую связь и родство языков, а где она показывает ареальные языковые союзы, а где она показывает случайные совпадения.

Генетическая классификация языков, наоборот, имеет совершенно прозрачную историческую интерпретацию. Генетическая классификация - это классификация языков по признаку наличия или отсутствия у них ближайшего общего предка. Языки, представляющие собой результат исторического развития из одного праязыка после того, как его носители расходятся в разные стороны, попадают в одну группу, и типологическая классификация (очень важна типологическая характеристика языка) может измениться со временем, при этом очень значительно, а генетическая классификация языка неизменна. Языку для того, чтобы сменить свою генетическую классификацию, остается только умереть. С другой стороны, вопрос о том, как строить генетическую классификацию, точнее, как правильно ее строить, чтобы в результате появлялась максимально правдоподобная картинка, намного сложнее, чем вопрос построения классификации типологической.

...Самый тяжелый случай - это классификация языков на глубоком уровне, когда мы из области обычной традиционной компаративистики перемещаемся в область макрокомпаративистики. Это направление сравнительно новое, во многом противоречивое, спорное, и здесь еще добавляется дополнительная проблема - скудность сопоставительного материала. Согласно классической теории, которую разработал отечественный лингвист Владислав Маркович Иллич-Свитыч, индоевропейская семья, о которой мы только что говорили, на более глубоком уровне, условно скажем, 12 тысяч лет назад, входит в так называемую ностратическую макросемью, ее основные ветви разными цветами указаны на диаграмме, на карте, туда же входят алтайские языки, уральские языки, дравидийские языки в Индии и картвельские языки – маленькое пятнышко на Кавказе отмечено.



...Недавно прошла очередная сенсация, что якобы доказано близкое родство североамериканских языков группы на-дене с кетским языком Западной Сибири, так называемая дене-енисейская теория, и это было доказано на основании систематических корреляций в морфологических системах этих языков. На самом деле, языки действительно родственны, по-видимому, в рамках большой дене-кавказской макросемьи, сама идея довольно старая, но грамматические параллели, которые автор этой гипотезы приводил, на поверку оказываются фиктивными, плодом его исследовательской фантазии.

Часто приходится слышать утверждения, что грамматика языка более стабильна, чем лексика, что она устойчивее по отношению к заимствованиям, чем лексика, и это, наверное, правда, но, тем не менее, насчет грамматики как идеального показателя родства все не так просто. На близких хронологических расстояниях грамматика обычно хорошо работает. Если мы возьмем, к примеру, грамматику русского языка и сопоставим ее с польской грамматикой, этого будет достаточно для того, чтобы показать их генетическое родство. А как насчет русского и английского языка, которые, безусловно, родственны, но общих грамматических морфем по памяти я могу восстановить буквально 2-3, а это, как вы понимаете, может быть плодом случайного совпадения? Если бы мы не знали истории английского языка и истории русского языка, никакая грамматика не помогла бы. Или, например, как быть с языками, в которых грамматики, морфологии, систем склонения, спряжения нет вообще, так называемыми изолирующими языками, которые очень широко распространены в Юго-Восточной Азии, - тот же китайский или вьетнамски?. Там грамматика вообще не может служить критерием.

...Те изменения, которые происходят не в результате контактов, происходят примерно с одинаковой скоростью, и, подсчитав проценты лексических совпадений между родственными языками, там, где дело касается только внутренних изменений, мы можем по некоторой формуле высчитать даже примерную дату их происхождения – это так называемый глоттохронологический метод, который как раз и придумал Сводеш по аналогии с радиоуглеродным методом датирования, и называется это глоттохронология или лексикостатистика.



Сейчас мы оперируем сверхустойчивой половиной из пятидесяти элементов. Это универсальный список, понятия обнаруживаются практически во всех языках мира, и он очень показателен.

...В-третьих, что еще более важно, этот же список Сводеша, из каких бы элементов он ни состоял, может и должен быть ранжирован. Каждое слово обладает некоторым индексом стабильности по терминологии Сергея Анатольевича Старостина, который разрабатывал методику такой среднестатистической степени устойчивости, которую мы вычисляем на эмпирической основе. Если мы берем семью из 10 языков, то слово глаз будет в ней, скорее всего, очень устойчивым. Мы, может быть, найдем 1-2 разных корня, которые представляют значение слова глаз в этой семье, наоборот, если мы возьмем слово маленький или слово желтый, то для этих слов почти 100%, если не в каждом языке будет свой корень, то, по крайней мере, 5-6 разных корней точно будет представлено – эти слова гораздо чаще меняют свое значение, чем слово глаз.

На эмпирической основе список Сводеша можно хорошо разделить на сильно устойчивую половину и слабо устойчивую половину. Мы тестируем два языка на родство: в какой половине списка Сводеша у нас больше совпадений – в сильно устойчивой или слабо устойчивой? Должно быть обязательно в сильно устойчивой, а если в слабо устойчивой, это опять пахнет горизонтальными контактами, потому что странно, что между этими двумя языками заменились устойчивые слова и, наоборот, не заменились неустойчивые слова.

...Мы имеем лексические списки по любым современным языкам (индоевропейским, уральским, сино-тибетским, африканским, каким угодно). Вычленяя мелкие близкородственные группы, мы отсеиваем, так сказать, шелуху, лексические инновации и превращаем стословные списки современных языков в прасловники, опираясь на аппарат сравнительно исторического языкознания. Потом мы сравниваем между собой эти прасловники и переходим все глубже и глубже от русского к праславянскому, от праславянского - к праиндоевропейскому, от праиндоевропейского - к ностратическому и так далее.

Вопрос: как далеко мы можем идти, можем ли мы на основе анализа базисной лексики построить общемировое древо языков – или, наоборот, показать на основе анализа базисной лексики, что все макросемьи мира все-таки невозможно свести к единому праязыку? Ответ на этот вопрос я не дам в первую очередь потому, что не закончен этап обработки первичного материала, а во вторую - по теоретически пока не решенной проблеме утраты информации. Стандартная претензия, которую скептики предъявляют к макрокомпаративистике такова: вы говорите, что 12-14 тысяч лет тому назад существовала ностратическая макросемья. Как же можно это доказать, если за этот период все ее потомки изменились настолько, что сегодняшнее сходство между ними уже неотличимо от случайных? Тот же самый список Сводеша за 12-14 тысяч лет изменяется в среднем на 90-95%. Во многом мы эту проблему снимаем, опираясь на вышеупомянутый ступенчатый принцип реконструкции. Разные языки утрачивают разные элементы праязыка, и реконструкция тем и ценна, что она собирает воедино раскиданные по разным уголкам кусочки этого пазла. Если у современных языков 5-6% совпадений, мы проделываем реконструкции и видим, что в каких-то случаях количество совпадений возрастает между реконструкциями до 12-14-15%. Это верный показатель того, что макросемья, которую мы восстанавливаем, действительно реальна, но, тем не менее, даже этот ступенчатый признак тоже нельзя считать универсальной панацеей.


Ностратическое и сино-кавказское деревья по данным 50-словных списков (проект «Эволюция языка»)
http://www.polit.ru/img/ggl/starostin_12.html - http://www.polit.ru/img/ggl/starostin_12b.gif

...И вся кухня, которую я сегодня показал, довольно успешно работает на глубинах хронологических примеров 10-12 тысяч лет, а для того, чтобы она работала дальше, и для того, чтобы мы могли точно создать единое древо для всех языков – или, наоборот, показать, что его невозможно создать, - должно быть усовершенствование методики, которое, я надеюсь, в ближайшее десятилетие появится. На этом я закончу. Спасибо.

...Борис Долгин: Расскажите, пожалуйста, о попытках работы с генетикой и археологией

Георгий Старостин: ...К сожалению, она далеко не вся написана на надлежащем уровне - и в первую очередь по тому прискорбному обстоятельству, что в мире практически нет людей, которые были бы одинаково квалифицированны в области археологии и лингвистики или генетики и лингвистики. Я, например, плохо квалифицирован как археолог или как генетик - и наоборот, когда я читаю работы археологов и генетиков, то почти всегда, когда они начинают оперировать лингвистическими понятиями, хочется схватиться за голову. Можно дать подробный ответ, как мы пытаемся скоррелировать эти данные, но это курс лекций на 1-2 семестра. Краткий ответ тот, что все это находится в зачаточном состоянии, потому что пока нет жестких и общепринятых критериев отождествления лингвистических данных с археологическими и генетическими, причем ситуация еще усугубляется тем, что данные всех трех областей наук все время изменяются и дополняются. Мы можем сегодня построить какую-то разумную соотносительную модель, положить на нее уйму времени, а потом обнаружится новый археологический слой, или генетики еще добавят пару признаков, по которым они классифицируют народы, - и вся модель окажется перечеркнутой. Я, в принципе, настроен очень оптимистически, и рано или поздно все три типа сведений будут хорошо соотнесены, но не пришло еще то время, когда мы могли бы заниматься этим всерьез: еще и лингвистам, и археологам и генетикам довольно много нужно работать.

....Георгий Старостин: Что касается того, когда могла начаться дивергенция языка. В тот момент, когда Homo sapiens стал расселяться по планете, в этот момент и могла начаться дивергенция языка. К какому времени мы относим этот момент? Миграции из Африки начинаются 60 тысяч лет назад, хотя язык мог начать дивергировать и раньше, и в самой Африке. Что касается мощности, глубины сравнительно-исторического метода, то мы зависим в первую очередь от тех языков, которые мы видим сегодня, – сколько потомков сегодня мы видим, такова и наша мощность. Если, например, историческая ситуация была такова, что от первоначального языка человечества откололись несколько ветвей, и ушли Бог знает куда, и там замерзли во время последнего ледникового периода, например, то это уже автоматически значит, что первоначальный язык человечества мы не реконструируем никогда. У нас, в общем и целом, хотя уже перехожу скорее к интуитивным соображениям, есть несколько языковых зон: одна - очень большая, в которую входят практически все языки Евразии, подавляющее большинство языков Африки и все языки Америки; другая зона, имеющая с этой гораздо меньшее количество сходств, – это тихоокеанская зона Папуа Новая Гвинея и Австралия; и третья зона, еще менее похожая на две предыдущие, - это Южная Африка. Бушмены и готтентоты, так называемые койсанские языки, которые типологически безумно сильно отличаются от всех остальных в первую очередь наличием в них специальных типов так называемых щелкающих звуков, но также и по своей лексике абсолютно ни на кого не похожие. Можно в качестве рабочей модели принять некое членение всех языков человечества на эти три группы: одна, условно говоря, папуасско-австралийская, другая – южноафриканская, бушмено-готтентотская и третья – все остальные. Таким образом, бушмено-готтентотские языки - это языки, которые родились в Африке и из Африки никуда не уходили никогда, там остались жить и сегодня доживают свои последние дни, будучи нещадно истребляемы другими, более продвинутыми в культурном отношении языками и народностями. Вторая – это условно первая волна миграции из Африки, которая дошла до Папуасии и Австралии, и третья – все остальное – это более новая волна миграций, условно 30 тысяч лет до нашей эры, которая заселила не только все оставшиеся незаселенные куски планеты, но и, по-видимому, вычистила как следует огромный пласт предыдущего языкового наследия. Это некоторая рабочая схема, которая основана на интуиции, опыте работы с разными языками, но не поддержана пока еще строгими научными выводами.

...Голос из зала: Скажите, были ли случаи в изучении языков, когда обнаруживался язык, который нельзя было отнести ни к какой семье? Я эти вещи читал, но подозреваю, что они должны быть утки.

Георгий Старостин: Нет, это не утки. Есть так называемые языки-изоляты, которые, если к какой-то семье относились когда-то, то очень давно от нее откололись, долгое время существовали сами по себе, варились в собственном соку, и сегодня их генетическую принадлежность установить либо очень сложно, либо почти невозможно. Таких примеров очень много в самых разных частях света. Для некоторых языков есть довольно хорошо подтверждаемая гипотеза их родства в рамках макросемей. Баскский язык в Испании, который часто считается изолятом, - существует хорошее свидетельство того, что он, по-видимому, все-таки входит в дене-кавказскую семью языков, дерево которой еще висит на экране. Бывают такие языки, генетическая принадлежность которых даже в рамках теории макросемей до сих пор совершенно неопределима. Шумерский, например: существует несколько конкурирующих гипотез о том, чему родствен шумерский, но ни одна из них не лучше другой, и, значит, все одинаково плохи. В Африке есть некоторое количество таких языков, да и в Америке довольно много. По-видимому, какие-то из них удастся разделить в ходе дальнейшей работы по отдельным ветвям общего древа, а какие-то, возможно, так навсегда и останутся изолятами.

...Прогнозы делать очень тяжело в этом отношении, и в первую очередь - потому что мы сегодня живем в мире, который очень сильно отличается от того мира, который существовал еще 200-300 лет тому назад, не говоря уже о гораздо большей древности. Таких тенденций глобализации, которые сегодня появляются, никогда раньше не существовало, хотя были какие-то до некоторой степени похожие модели. Сегодня, в общем и целом, прослеживается тенденция, в первую очередь, к вымиранию огромного количества языков. Из тех 6909 языков «Этнолога», которые я упоминал в начале, по разным прогнозам: кто-то говорит, что за следующие 10 лет вымрет 1000 языков, кто-то говорит, что за следующие 20 лет вымрут 3000 языков, но общая тенденция в общем и целом видна, население мелких населенных пунктов с большим удовольствием переходит на язык своего большого могучего соседа, кем бы он ни был, китайским, английским, хинди, кем угодно, но что все мы придем в результате этого в какой-то момент к полному единству, что все языки опять сольются в некоторый единый язык, будь то английский или какой-нибудь еще, в этом серьезнейшее сомнение, потому что, на самом деле, слишком велика тяга к дивергенции, и слишком огромен мир для того, чтобы все могло так плачевно закончиться. Даже если все унифицируется или половина людей земного шара будет говорить по-английски, то этот английский язык сам по себе в конечном итоге сам разделится на несколько языков, так как это происходило много раз в ходе истории человечества, когда огромная территория начинала говорить на одном языке, а потом, скажем, в ходе индоевропейской экспансии 5-6 тысяч лет тому назад половина Евразии заговорила на индоевропейском языке - и чем это закончилось? Сегодня вместо одного индоевропейского языка существует триста. Примерно то же самое постигнет любой другой язык, которому удастся унифицировать, глобализовать человечество в сколь-либо обозримом будущем.
Tags: language2
Subscribe

  • Последним был стим-панк...

    Тема тут очень сложная. Мне надо как-то так произнести, чтобы не говорить то, чего говорить не следует. Боюсь, получится невнятно и будет совсем…

  • Длинное время истории души

    У меня вопрос, и сначала я скажу, как я до него добрался. Есть самые разные тексты про медитации, развитие способностей и т.п. Когда я читал эти…

  • Редкое умение (индивидуация)

    Я бы полагал важным и редким умением - составление описаний объектов с минимальными отсылками к общим понятиям. Например, описание человека. Его…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 20 comments

  • Последним был стим-панк...

    Тема тут очень сложная. Мне надо как-то так произнести, чтобы не говорить то, чего говорить не следует. Боюсь, получится невнятно и будет совсем…

  • Длинное время истории души

    У меня вопрос, и сначала я скажу, как я до него добрался. Есть самые разные тексты про медитации, развитие способностей и т.п. Когда я читал эти…

  • Редкое умение (индивидуация)

    Я бы полагал важным и редким умением - составление описаний объектов с минимальными отсылками к общим понятиям. Например, описание человека. Его…