28 июля в журнале Science была опубликована статья [1] исследователей из Института эволюционной антропологии Общества Макса Планка и их коллег, посвященная прародине индоевропейских языков. Публикуем комментарий лингвистов Алексея Касьяна и Георгия Старостина (полностью их неформальная рецензия доступна здесь: academia.edu/105839899.

Алексей Касьян, вед. науч. сотр. Школы актуальных гуманитарных исследований Института общественных наук РАНХиГС:

Статья [1] представляет собой как минимум третью версию индоевропейского (ИЕ) дерева, опубликованную группой Рассела Грея и Квентина Аткинсона (см. [2], [3]). Каждый раз авторы заявляют о решении масштабных проблем индоевропейского этногенеза, расстановке точек над i и тому подобном. Каждая из трех статей состоит из базы данных со списками базисной лексики ИЕ языков, компьютерного обсчета (построение датированного генеалогического дерева) и исторической (археологической, генетической) интерпретации результатов.

Сначала надо коснуться научного контекста. Две предыдущие статьи были разгромно раскритикованы индоевропеистами и вообще историческими лингвистами как за некачественные входные данные (многочисленные ошибки в базе), так и за итоговые деревья, которые содержали узлы и даты, слишком противоречащие традиционным взглядам индоевропеистов. Неприятие было настолько сильным, что в индоевропеистических журналах рецензенты могли попросить авторов рукописи не давать прямых ссылок на публикации команды Грея и Аткинсона.

В новой статье авторы прислушались к критике и радикально улучшили лексические списки. Была организована группа из примерно 80 лингвистов — специалистов по тем или иным языкам ИЕ семьи, — которые работали, насколько мне известно, более пяти лет. Но главное, что если раньше списки составлялись «на глазок», то сейчас эта научная группа приняла довольно строгую методологию составления списков. По сути, это методология нашей московской группы в версии примерно пятилетней давности. Это прежде всего строгие семантические дефиниции концептов, диагностические контексты, опора на качественные словари и грамматики (а не на анонимные, например, лексические списки из «Википедии», как в статье 2012 года), отказ от синонимов. Все эти принципы были впервые обнародованы нашей группой в 2010 году [4] и с тех пор регулярно нами применяются (а сейчас у нас накопилось еще немало новых наработок и технических приемов, позволяющих дополнительно очистить входной лексический материал).

Основа базисной лексики ИЕ языков IE-CoR получилась весьма качественной. Я выборочно проверил списки трех языков и почти не нашел ошибок. Такая база, которая к тому же доступна онлайн [5] с различными функциями поиска и фильтрации, — это действительно хороший результат, за который нужно похвалить авторов. Базу можно и нужно дорабатывать, но работа была проделана большая и качественная.

Однако генеалогическое дерево ИЕ языков получилось невразумительным. Оно неустойчиво (у многих узлов чрезвычайно низкая статистическая поддержка), топологически оно не просто не дает ответы на основные вопросы, как делились ИЕ языки, но и содержит явно неприемлемые узлы (например, хетто-тохарский). Дерево настолько неудачно, что авторы не стали его публиковать в самой статье, а привели где-то в середине многостраничного приложения к тексту. Почему такой результат? Я не могу сказать без детальных тестов. Возможно, какие-то ошибки в матаппарате. Или 170 признаков (сводешевских концептов) — маловато для робустной классификации 161 языка. Возможно, те методологические новшества, которые за последнее время разработала наша группа (прежде всего очистка списков от «деривационного дрифта»), помогла бы сделать дерево более устойчивым.

Соответственно, и всё обсуждение палеогенетики, археологии и путей миграции древних ИЕ племен, чему в рецензируемой статье уделено много места, подвисает в воздухе, так как базируется на неправдоподобном дереве языков.

Отмечу, что в статье по ИЕ филогении, недавно опубликованной нашей группой [6], мы получили робустное дерево, ни в топологии, ни в датировках узлов не противоречащее ранее установленным в индоевропеистике положениям. Данное исследование было выполнено в рамках проекта консорциума «Центр междисциплинарных исследований человеческого потенциала».

Георгий Старостин, вед. науч. сотрудник Центра компаративистики и филогенетики Института классического Востока и античности НИУ ВШЭ:

У опубликованной работы на самом деле довольно длинная предыстория; первые публикации новозеландской исследовательской группы Грея — Аткинсона по теме индоевропейской филогенетики и исторической датировки распада индоевропейской общности, датируемые 2003 годом, были в некотором роде призваны подтвердить так называемую анатолийскую гипотезу, согласно которой прародина индоевропейцев локализировалась (примерно) на территории Малой Азии, первые миграции индоевропейских племен привязывались к распространению земледелия с территории Левантийского очага, а распад индоевропейской общности датировался (самое позднее) VIII–IX тысячелетиями до н. э. Этот сценарий был впервые подробно описан выдающимся археологом, лордом Колином Ренфрю еще в 1987 году и с тех пор считается главной (хотя далеко не единственной) альтернативой «мэйнстримному» сценарию так называемой курганной гипотезы, согласно которой прародина индоевропейцев помещается в причерноморские степи, распад датируется гораздо более поздним периодом (примерно IV тысячелетием до н. э.), а миграции индоевропейцев связываются скорее с распространением скотоводства, нежели земледелия.

«Новозеландцы» (Рассел Грей, Квентин Аткинсон, Саймон Гринхилл и другие активные участники нынешней команды, обосновавшейся в Институте эволюционной антропологии Общества Макса Планка) с самого начала тяготели к поддержке гипотезы Ренфрю; причины такой любви мне не до конца понятны, но, возможно, это как-то связано с тем, что применяемые ими методы калибровки и расчета даты распада праиндоевропейской общности с самого начала (еще в статье 2003 года) показывали существенно более древние даты, чем принятые в рамках курганной гипотезы. При этом стоит подчеркнуть, что, например, более старые расчеты по разного рода глоттохронологическим формулам, исходящим из концепции о постоянной и равномерной скорости изменения базисной лексики, почти неизменно дают более «молодые» даты; да, собственно говоря, и в работах нашей команды [6], а также в ряде других «конкурирующих» исследований, использующих вероятностные методы (например, Chang et al. 2015), даты и деревья получались намного более приемлемыми с точки зрения давно устоявшихся перспектив классической индоевропеистики. Всё это наводит на несколько грустные мысли о том, что формальные модели для разработки исторических сценариев развития на самом деле можно, чуть-чуть подкрутив параметры, настроить на любой удобный для себя результат — вне зависимости от того, насколько хорошо он отвечает известным историческим фактам или элементарному здравому смыслу.

Приведу лишь один содержательный аргумент, который в работе [1] обсуждается лишь вскользь, да и то только в приложении к самой статье. Для праиндоевропейского языка довольно надежно реконструируется лексический сет, связанный не только со скотоводством, но и напрямую с коневодством и колесничным делом (*hekwos ʽлошадь’, *kʷekʷlo- и *rotho- ʽколесо’, даже *heks- ʽось колеса’ и др.). Реконструкции очень уверенные, так как потомки этих слов встречаются в разных индоевропейских ветвях, регулярно соответствуют друг другу и имеют требуемое значение. Поскольку факт наличия таких слов в праиндоевропейском категорически противоречит удревнению даты его распада (даже в VII тысячелетии до н. э. ни о каких ʽколесах’ еще говорить не приходится), авторам приходится его как бы «заметать под ковер» — аргументируя, например, тем, что слово *kʷekʷlo- (предок санскритского cakra, греческого kyklos, английск. wheel и др.) в праязыке могло обозначать какой-то ʽколесообразный объект’ (много ли их таких встречается в природе, чтобы потребовать образование отдельного слова?) и приобрести «культурное» значение ʽколесо’ уже независимо друг от друга в разных ветвях сильно после распада праиндоевропейского. Такие рассуждения вообще трудно воспринимать всерьез; это скорее из области «если теория противоречит фактам, тем хуже для фактов».

Отметим, впрочем, что некоторый «прогресс» в опубликованной статье [1] всё же содержится — помимо того, что она основана на значительно усовершенствованном датасете, в ней как минимум очерчивается идея частичного «консенсуса» между анатолийской и курганной гипотезами, который уже задолго до этого предлагался и в западной, и в отечественной компаративистике; например, покойный С. А. Старостин симпатизировал идее «ранней» анатолийской прародины и первого распада индоевропейской общности, в ходе которой отделяется собственно анатолийская ветвь (куда входят вымершие хеттский, лувийский и другие древние языки Малой Азии), и затем, уже в IV–III тысячелетиях до н. э. — «поздней» курганной прародины и второго распада, в ходе которого уже образуются все основные известные нам индоевропейские ветви (индоиранская, балто-славянская, германская, италийская и др.). Это косвенно может подтверждаться и тем, что пресловутая «коневодческо-колесничная» лексика в анатолийских языках совсем другая, и, значит, индоевропейцы могли одомашнить лошадей и научиться делать колесницы уже после отделения анатолийских языков. При этом, однако, текущая филогенетическая схема Грея, Аткинсона и др. такой исторический сценарий не поддерживает — согласно их дереву, все основные индоевропейские ветви должны были распасться почти сразу, задолго до колес и лошадей. Понятно, что так или иначе они всё равно пропихивают сценарий Ренфрю, согласно которому диффузия индоевропейцев по Евразии связана с их успехами в области развития земледелия, — но с этой концепцией, боюсь, никогда не согласится подавляющее большинство индоевропеистов, занимающихся реальной работой в области лексической и культурной реконструкции индоевропейского праязыка, а не просто подгонкой данных под те или иные труднопроверяемые математические модели.

1. Heggarty P., Anderson С., Scarborough M., King B., Bouckaert R., Jocz L., Kümmel M. J., et al. 2023. Language trees with sampled ancestors support a hybrid model for the origin of Indo-European languages. Science 381(6656). eabg0818. doi: 10.1126/science.abg0818.

2. Gray R. D. & Atkinson Q. D. 2003. Language-tree divergence times support the Anatolian theory of Indo-European origin. Nature 426. 435–439. doi: 10.1038/nature02029.

3. Bouckaert R., Lemey P., Dunn M., Greenhill S. J., Alekseyenko A. V., Drummond A. J., Gray R. D., Suchard M. A. & Atkinson Q. D. 2012. Mapping the origins and expansion of the Indo-European language family. Science 337. 957–960. doi: 10.1126/science.1219669.

4. Kassian A. S., Starostin G., Dybo A. & Chernov V. 2010. The Swadesh wordlist. An attempt at semantic specification. Journal of Language Relationship 4. 46–89.

5. iecor.clld.org

6. Kassian A. S., Zhivlov M. A., Starostin G. S., Trofimov A. A., Kocharov P. A., Kuritsyna A. & Saenko M. N. 2021. Rapid radiation of the Inner Indo-European languages: an advanced approach to Indo-European lexicostatistics. Linguistics 59(4). 949–979. doi: 10.1515/ling-2020-0060.