Иванов-Петров Александр (ivanov_petrov) wrote,
Иванов-Петров Александр
ivanov_petrov

Categories:

Разговор лингвиста и генетика

http://ivanov-petrov.livejournal.com/1481524.html?thread=72790324#t72790324
Длинный разговор, где под конец выясняется, чем сейчас приличные люди заняты. Можно подглядеть. Разговор - о древней истории человечества. Потом - о применении кладограмм к эволюции языков.

kassian
Как у смежника и неспециалиста возникло несколько вопросов к уважаемому [info]prahvessor.

1. Время же «настоящего» расхождения кроманьонца и неандертальца, оцененное с использованием различных популяционных моделей, составило 270-440 тыс. лет.

Под кроманьонцем понимается прямой предок h. sapiens sapiens, т.е. нас?
Если да, то вот тут у John Hawks даются удревленные даты по мДНК (со ссылками на современную лит-ру):

321,200–618,000 years ago

Предыдущая датировка глубже: 660,000 years ago

Я так понимаю, это вполне традиционные датировки, нет?


2. наше расхождение с неандертальцем началось примерно 800 тыс. лет назад

Аналогично п.1
По мДНК "779,300–1,313,500 years ago", усредненно: "1,040,900 years ago".

3. Эти же данные были подтверждены при секвенировании образцов из Эль-Сидрона в Испании, пещеры Межмайская на Кавказе и из самой долины Неандерталь в Германии, несмотря на то, что материал из Межмайской на 20-30 лет старше, чем из других мест.

Что имеется в виду под "на 20-30 лет старше"?

4. Кроме того, следует учесть, что если взять два индивидуальных генома, среднее время их расхождения будет больше, чем время расхождения соответствующих видов (т.е. время от момента, когда прекратился массовый поток генетической информации между популяциями) в силу сложной структуры любой природной популяции.

Т.е. необходимо брать материал из нескольких экземпляров.
А сколько экземпляров необходимо для построение достаточно вероятной модели?

4. Отличия генома неандертальца от генома кроманьонца составили 12% от разницы между геномами человека и шимпанзе. [...]
Для сравнения, для пар кроманьонцев из разных популяций средний уровень различий составил примерно 8-10% от различий человек-шимпанзе.

Это действительно так? Т.е. ошибка при сравнении изолированных экземпляров может быть ТАКОГО масштаба?

Если да, то как мы можем оценивать время расхождения h.sapiens с популяцией того единичного экземпляра, чью фалангу нашли в Денисовой пещере?

5. В соответствии с археологическими данными самый вероятный сценарий — контакт между неандертальцами и кроманьонцами на Ближнем Востоке 10050 тыс. лет назад. [без ссылки на источник]

Если я правильно понял, то это заявка на некоторую археологическую революцию.
Традиционно самые поздние находки неандертальце -- это где-то 30 000 BP
Ближний Восток 10 000 BP -- это уже совершившаяся неолитическая революция, производящее хозяйство, множество костяных находок. Но я нигде и никогда не встречал упоминания, что какие-либо из этих костей можно атрибуировать неандертальцам.

Это точно не опечатка?

prahvessor
1-2. насколько я понимаю, кроманьонцы - это мы и есть. Даты, да, не противоречат традиционным

3. тыс. лет, конечно. В следующем номере будет "работа над ошибками"; там еще описка есть, гораздо хуже

4 первый раз. во-первых, не знаю. Во-вторых, видимо, сильно зависит от истории популяции (бутылочные горлышки и т.п.). Вообще, наука про коалесценцию, мне кажется, довольно мутная.

4 второй раз. Говорят, так. Из Денисовой секвенировали пока только митохондриальный геном, к нему эти числа впрямую неприменимы.

8-10% - это не ошибка, а разные расстояния между популяциями (все, включающее койсанов, больше)

5. Опечатка. В бумажной версии Троицкого варианта было правильно, 100 тысяч. Нолик пропал в какой-то момент

kassian
> 8-10% - это не ошибка, а разные расстояния между популяциями

С математической точки зрения по-прежнему не понимаю.
У нас есть абсолютная дата -- расхождение между шимпанзе и H.sapiens. (Дата эта получена "на глазок" и абсолютной не является, но примем как абсолютную.)

Отсюда вычисляем скорость изменения генофонда. Принимаем, что эта скорость постоянна.

Если между H.s.sapiens и H.s.neanderthalensis различия составляют 12% от различий между шимпанзе и H.s.sapiens, то мы считаем, что расхождение между H.s.sapiens и H.s.neanderthalensis произошло X лет назад (скажем, 1 000 000 BP).

Если (по аналогичной методике) расхождение между двумя популяциями H.s.neanderthalensis дает 10%, то это значит, что разделение между популяциями произошло почти сразу после отделения H.s.sapiens.

Разве нет?

prahvessor
про 10% между неандертальцами - это какое-то недоразумение, я про это, кажется, не писал

между кроманьонцами - таки, да, 10% от. Но тут все-таки надо различать различия между индивидуальными геномами (что, грубо говоря, пропорционально отрезку времени до того, как когда жил усредненный общий предок двух индивидуумов) и расхождение видов (прекращение массового обмена фрагментами геномов в результате скрещиивания и рекомбинации). В силу существования родословных, первое бывает куда раньше второго. На больших расстояниях (человек-шимпанзе) это не так существенно, и имеет смысл говорить о генетическом расстоянии между видами. На малых - видимо, правильнее говорить о распределении генетических расстояний между индивидуумами.

Коллеги меня поправят в случае чего, но теоретически я легко могу себе представить ситуацию, когда общий предок двух, скажем, кроманьонцев (опять же, усредненный - потому что по разным участкам генома эти общие предки разные), жил еще до расхождения кроманьонцев и неандертальцев. Это даже не обязательно должны быть представители двух изолированных популяций.

Я старался это внятно пересказать - все-таки, посмотрите полный текст в "Троицком варианте". А еще лучше - оригинальную статью

kassian
> про 10% между неандертальцами - это какое-то недоразумение, я про это, кажется, не писал

Это я спутал. Да, между кроманьонцами (но на теоретическую суть вопроса это не влияет).

Уточняющий вопрос.

Если взять не двух изолированных особей H.s.s., а две популяции H.s.s.
Данные о генофондах внутри популяций расчитываются как "среднее по больнице".

Сколько процентов по нашей шкале (шимпанзе-H.s.s.) получится разницы?

a) Если взять крайние точки. Скажем, сравнить северную популяцию русских с койсанами?

b) Если не крайние. Скажем, тех же северных русских с какой-нибудь группой индейцев Южной Америки.

Интересует, разумеется, не точные цифры, а порядок.

2%? 5%? 10%?

prahvessor
насколько я понимаю, европейцы с азиатами (ну или с индейцами) 8%; кто угодно с койсанами 10%

у меня сейчас статьи под рукой нет, там были числа

только я, кажется, переформулировал по ходу вопрос: я не понимаю, как считать разницу между генофондами. Я усреднял по всем парам особей из одной и другой популяции - это, видимо, не то же самое.

это, кстати, согласуется с старой оценкой, что два человека (точнее, два гаплоидных генома) отличаются в среднем в одной позиции на тысячу, а человек-шимпанзе в одной на сто. Это только про точечные различия, без делеций, дупликаций и прочих перестроек.

kassian
> Я усреднял по всем парам особей из одной и другой популяции - это, видимо, не то же самое.

Да, я это и имел в виду, просто терминологически плохо выразился.

Если можно, еще один уточняющий вопрос.

Сколько процентов разница (по нашей шкале):
a) между усредненной популяцией койсанов и ненадертальцами?
b) между какой-либо усредненной популяцией нынешних европейцев и ненадертальцами?

prahvessor
насколько я понимаю, будет примерно одинаково 12%, у европейцев чуть меньше ровно за счет примеси. Опять же, надо статью посмотреть, на работе осталась, а в такую дымину в центр ехать... И по-любому надо бы, но здоровье дороже, из дома пытаюсь чего-то ваять. Впрочем, в статье по популяциям не смотрели, а только по нескольким индивидуумам. Если не забуду, потом отпишу. Если критично - бросьте напоминалку.

kassian
Понятно. Спасибо.

Опишу свою цель. Мне хочется понять, какие практические импликации несет нам знание геномов. В основном (как историку) хочется понять, можем ли мы с этой помощью уточнять карту доисторических миграций.

Из указанных цифр (12% между любыми популяциями H.s.s. c H.s.n.; 10% между популяциями H.s.s. c койсанами; 8% между популяциями H.s.s. в Европе и Азии) следует, что разделение ствола H.sapiens шло очень быстро.

Что, видимо, странно с точки зрения традиционной эволюционной модели? Но при этом аргумент задревления (то, что Вы выше писали о генеалогическом дереве отдельных индивидуумов) не должен иметь силу, потому что разделение на популяции -- с исторической точки зрения, скорее всего, откочевывание части племени на новую территорию. Именно части племени, т.е. какой-либо значимой группы индивидуумов, а не отдельной пары самец-самка.

prahvessor
в принципе, это лучше спрашивать у специалистов. Про койсанов писали, что они отделились тыщ 70 лет назад и до 30 тысяч л.н. жили в изоляции (даты по памяти, надо проверить).

Чтобы учесть "задревление" и влияние родословной, надо еще учесть среднее различие внутри популяции, которого я не знаю сходу, но, видимо, оно сопоставимо (т.е. тоже ближе к 7-8-10%). Так что быстрого очень древнего разветвления все-таки не выходит.

Опять же, по-хорошему, это уже надо идти к настоящим популяционным генетикам. Насколько я понимаю, кое-какие карты миграций они делать умеют, но не знаю, достаточно ли там разрешение (как существующее, так и теоретически достижимое - например, если мы будем знать все геномы всех живых людей, и еще все кладбища раскопаем), чтобы сопоставлять с картами языков. Поскольку дело редко сводится к миграциям, все перемешивается по дороге, фактически то, что рисуется - это "изотермы" частот различных вариантов (скажем, митохондриальных гаплотипов) - в отличие от изоглосс, эта штука по определению недискретная, но выглядит интересно - как языки, которые, в принципе, и должны показывать путь миграции. Разумеется, разглядывать такие карты и сопоставлять их с теми же пучками изоглосс и с разными аржеологическими распределениями, видимо, должно быть поучительно; насколько велика реальная и, опять же, теоретически достижимая (если аккуратно раскопать все археологические памятники и посчитать все-все черепки, да еще уметь правильно навести на них дифференциальные признаки), доказательность таких сопоставлений - не знаю.

Что пока получается, это делать достаточно грубые утверждения: такие-то популяции являются разными или, наоборот, близкими; грубо оценивать уроеень смешения (но это, видимо, должно сильно зависеть от начальных предположений, и потом, для языка и материальной культуры и чуть-чуть могло бы хватить - кто знает?). Такого сорта утверждения сделали про европейских земледельцев и собирателей - про это я писал - и про древнее население, чтобы не соврать, Гренландии?, - секенировали геном из вечной мерзлоты, и оказалось, что современные эскимосы ему не родственники. Опять, для как следует, надо посмотреть статью.

Еще были очень интересные статьи, я их тут где-то упоминал, про евреев: как там устроены генетически однородные группы, на кого они похожи и т.п., есть ли локальные примеси. У каких-то несчастных негров, которые называли себя евреями, а над ними все потешались, таки нашли в правильном количестве коэнскую Y-хромосому. Ну и т.п.

Казалось бы, в первом приближении можно просто брать генетическое расстояние между популяциями и сравнивать с географическим (или "географо-историческим", как мы его знаем) и с расстоянием по Сводешу(-Старостину). Я очень удивлюсь, если окажется, что такого не делали. Кавалли-Сфорца еще с классическими генетическими маркерами типа групп крови пытался что-то такое делать.

kassian
Да, диспропорция примерно ясна. Пока я вижу, что всё упирается в популяционную генетику ("наука мутная").
Возникает, например, вопрос: а если мы еще 20 популяций неандертальцев раскопаем и еще 20 популяций кроманьонцев, что, все даты изменятся?

> Казалось бы, в первом приближении можно просто брать генетическое расстояние между популяциями и сравнивать с географическим (или "географо-историческим", как мы его знаем) и с расстоянием по Сводешу(-Старостину).

Всё, что я видел, было или очень-очень грубым и гипотетичным (и не прибавляющим ничего к уже очевидным фактам) или же с налетом фричества.

Боюсь, что ни компаративистика, ни археология, ни генетика пока не готовы к обобщению и синхронизации. Т.е. про генетику, строго говоря, не знаю, а компаративистика и археология точно.

prahvessor
*обиженно* а то глоттохронология наука не мутная

а как там обстоит со статистической (или сравнительной) археологией, я даже не знаю. Когда я работал копальщиком в археологической экспедиции лет тридцать назад, а вечерами вел культурные разговоры с начальниками, не обстояло.

kassian
> а то глоттохронология наука не мутная

Мутная.
Но мы сейчас пытаемся сделать ее немутной. Имеется в виду публикация серии из "честных" статей, объясняющих метод, проблемы и т.п. По ходу дела и сам метод сильно формализуется, что не может не радовать.

Первая статья: G. STAROSTIN. Preliminary lexicostatistics as a basis for language classification: A new approach // Journal of Language Relationship, No. 3. P. 79–116.
Кажется, она была на starling.rinet.ru, но в ринете сдохли кондиционеры (как пишет Вербицкий), поэтому все сервера лежат.

Вторая статья: A. KASSIAN, G. STAROSTIN, A. DYBO, V. CHERNOV. The Swadesh wordlist. An attempt at semantic specification // Journal of Language Relationship, No. 4 (2010). P. 46–89.
Выйдет завтра (т.е. тираж журнала завтра будет, тогда выложу обе статьи где-нибудь в terra_linguarum).

Археология не могу сказать, что "мутная". Там как раз всё прозрачно. А проблема у них, что нет формализованных "реперных точек" для сравнения культур. Кто-то говорит: на керамику смотреть надо. Кто-то: на тип жилища, он самый архаичный и редко заимствуется.

А как сравнивать керамику между собой, тоже непонятно. Типа венчик похож, а орнамент другой. И т.п. и т.д.

prahvessor
Щазз. Это в каком смысле прозрачная, если дискретных признаков не очень есть (видел я эти венчики; тем более кремни), а даже если есть, то никакой естественной иерархии не составляют? Видимо, можно попробовать проделать что-то вроде стандартной морфометрии (взять много признаков той же керамики - там наберется много-то?), каждую стоянку (опять, сколько их будет-то?) описать количественно (в долях черепков, имеющих признак), потом устроить что-то вроде главных компонент с последующей кластеризацией. Ну и посмотреть, что получится. На более высоком уровне можно добавить менее количественные признаки (тип жилища, да?). Опять же: хорошо будет, если кластеры, полученные одним способом, будут разумно соотноситься с распределением прочих признаков. Неужто не делали?

На живых существах такое (не совсем - признаки не количественные, а бинарные, есть крылья - нет крыльев) как-то с грехом пополам работает, хотя классические систематики отмахиваются как черт от ладана - но они и от молекулярных деревьев отмахиваются. Но в хороших случаях есть какая-то относительно разумная корреляция между кладистическими деревьями и молекулярными.

В этой связи два вопроса. Американцы, насколько я понимаю, языковые деревья рисуют без особых тонкостей, а примерно по описанной выше процедуре. Оно насколько хорошо получается? И второй: если взять хорошую этимологию и нарисовать хорошее глоттохронологическое дерево, насколько его топология будет соответствовать тому, что получается из нормальной компаративистики с семьями, макросемьями и пр.? Парадоксов не будет? - я понимаю, что тут немножко самосбывающееся утверждение, поскольку "хорошая этимология" означает понимание фонетических соответствий, а последние подразумевают некоторую гипотезу о (макро)семьях и т.п. Но все-таки, если от этих методологических временно тонкостей отвлечься, что получится?

Но мы сейчас пытаемся сделать ее немутной. Имеется в виду публикация серии из "честных" статей, объясняющих метод, проблемы и т.п. По ходу дела и сам метод сильно формализуется, что не может не радовать.

а вот давайте я Вас осенью на семинар позову про это рассказать? Вот на этот: http://www.rtcb.iitp.ru/msb/2010.htm
Выжившие говорят, что процедура сильно способствует прояснению замутнения. Заодно можно будет попробовать и про генетику поговорить, хотя у нас человеческих генетиков мало, профессионального разговора может и не получиться. Хотя, опять же, можно и позвать кого послушать/поговорить.

Кстати, был у нас семинар номер 39 еще пятнадцать лет назад (http://www.rtcb.iitp.ru/msb/1995.htm) - это ликбез был, для нашего общего развития. Так что компания хорошая, хех.

kassian
Да, конечно. Про археологию не спорю. В этом смысле образцово мутная область знаний.

Я же имел в виду, что всякому, кто хоть чуть-чуть нюхал археологическую фактуру, ясно, что за утверждениями о "возможной преемственности культурой X культуры Y" немногое стоИт.

И я не думаю, что предложенный Вам формальный подход, давал бы результаты, которые интуитивно хотелось бы считать вменяемыми.

Кстати, как Вы понимаете, археологи на раскопках уничтожают множество находок (скидывают в отвал, разбивают лопатами). И это делается вполне сознательно. Не считается нужным присваивать инвентарный номер каждому черепку.

> Американцы, насколько я понимаю, языковые деревья рисуют без особых тонкостей

Ну, есть лексикостатистика. Построение дерева по X-словнику. Тут сложно налажать в процедуре. Основные искажения -- в отборе сырого материала. Дело в том, что М.Сводеш, благодаря своей гениальной интуиции, выдал 100-словник (наверное, некоторые элементы, типа экспрессивного 'round', там следовало бы заменить, но в целом инструмент совершенно рабочий). Однако не объяснил, что он понимает под своими однословными дефинициями.

Скажем, 'breast'. Обычно подставляют слово для женской груди, потому что это слово проще выяснить из словаря или у носителя. Но понятно, что женская грудь стандартно обозначается различными детскими формами (мама, тити, нана,..), которые никакой полезной информации не несут.

Есть и более анекдотические случаи. Сводешевское 'fly' явно обозначает 'to fly'. Однако в африканистике принято заполнять этот слот словом для мухи.

Также я видел 100-словники, где 'to lie' ("лежать", разумеется) заполнялось словами для "говорить неправду".

Но в целом лексикостатистические деревья должны получаться примерно одинаковыми.

Также существует дополнительная процедура -- глоттохронология. Т.е. приписывание абсолютных дат узлам дерева.
Вот тут копья начинают ломаться всерьез, деление на своих и чужих, составление черных списков в редакциях журналов, запрет на комплиментарное упоминание и т.п.

> если взять хорошую этимологию и нарисовать хорошее глоттохронологическое дерево, насколько его топология будет соответствовать тому, что получается из нормальной компаративистики с семьями, макросемьями и пр.?

Ну так нет же никакого другого инструмента, кроме лексикостатистики.

Консенсус в научном сообществе достигается только в случае неглубоких семей вроде славянской или германской (распад ок. 2 тыс. лет назад). Никто не спорит о выделении и составе этих семей.

Но уже балто-славянский праязык многими подвергается сомнению (мол, не было такого единого языка, а было вторичное сближение по причине территориальной близости и торговых контактов).

На самом деле существуют попытки кладистической классификации и.-е. языков по изоглоссам -- фонетическим, морфологическим и лексическим.
Недавнее дерево, которое я видел (вылетела из головы ссылка, могу найти), было достаточно похоже на лексикостатистическое дерево. Проблема в том, что такой подход не универсален и не формализуем -- непонятно, почему мы берем именно эти 30 изоглосс и отбрасывает 130 других.

Насчет семинара. Мне очень лестно Ваше предложение. Но подумайте, может быть Вам будет лучше пригласить непосредственно gstarst. Во-первых, он де-факто глава проекта. Во-вторых Гоша пропонент глоттохронологии, а у меня скорее амплуа скептика (условно говоря).

prahvessor
_Кстати, как Вы понимаете, археологи на раскопка уничтожают множество находок (скидывают в отвал, разбивают лопатами). И это делается вполне сознательно. Не считается нужным присваивать инвентарный номер каждому черепку._

те два раза, когда я был в экспедиции (Волго-Окская новостроечная), ничего подобного не происходило, а за халтуру дрючили нещадно. И очень берегли венчики, донца, и черепки с орнаментом, то есть ровно то, на что можно глядеть. Впрочем, там кроме черепков мало чего и было :-)

===

Я про это и говорю: есть топология дерева, и есть установление длин ветвей и потом датировки узлов. Топология может получаться из разных соображений (скажем, казалось бы, из очередности действия фонетических законов). Вот и интересно, до какой степени совпадает лексикостатистическая топология и "традиционная" компаративистская или, скажем, кладистическая.

kassian
> Топология может получаться из разных соображений (скажем, казалось бы, из очередности действия фонетических законов). Вот и интересно, до какой степени совпадает лексикостатистическая топология и "традиционная" компаративистская или, скажем, кладистическая.

Да, конечно. Но:

1. Строить по фонетическим изоглоссам пытались, но в принципе все признают, что фон. изоглоссы легко могут быть ареальным явлением. Скажем, есть запрет на начальное [r-]. Изоглосса тянется от др.-греческого до восточнокавказских языков. И что с этим делать? Да, из индоевропейских она захватывает др.-греч. и хеттский. Но нельзя же греч. и хет. объединять в один узел.

2. Традиционного дерева и.-е. семьи не существует. Есть много деревьев "на глазок" и по интуиции, предложенных различными авторитетными авторами. Все такие деревья не доказуемы и не опровергаемы.

3. Сейчас в типологии есть новый модный тренд. Берется набор типологических признаков (обычно бинарных или тернарных). Скажем, номинативный ~ эргативный ~ активный строй. Синтаксический порядок VS или SV. И т.д. Признаков в идеале должно быть много (несколько сотен?). И этот подход универсален, т.е. любой язык оценивается по единой матрице.

В результате строят схемы, какой язык к другому ближе. Графически это обычно оформляется не в виде дерева, а в виде таких завораживающих neighbourNet (а-ля биология и генетика), но не суть.

Результат получается грубым или неверным. Да, в основном объединяются генетически родственные языки, но слишком много и ложных срабатываний.
Наверное, этот метод туда-сюда для грубого выделения ядер крупных семей (типа и.-е.). Но уже внутри и.-е. он никак не годится.

При этом крупные семьи ведь и так легко выделяются без какого либо подобного формального алгоритма.

Понятно, что такой типологический метод будет работать только при презумпции: основная часть типологических характеристик является унаследованной от языка-предка.

Это очевидно ложная посылка. Всю дорогу мы видим образование языковых союзов, ареальное распространения типологических изоглосс и т.д.

Так что думаю, типологи с этими neighbourNet наиграются и через пару лет бросят (у них мода быстро меняется).

P.S. Вот, кстати, две статьи, которые я упоминал: http://community.livejournal.com/terra_linguarum/702530.html
Tags: biology4, language2
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 10 comments