Почти тридцать лет назад компьютер стал играть в шахматы лучше человека — это показал выигрыш в 1997 году программы Deep Blue в матче с действующим чемпионом мира (имя которого нынче не рекомендуется упоминать вследствие последующей политической активности, приведшей его в разного рода списки неблагонадежных граждан). После этого общественный интерес к шахматам как-то поутих, однако игра до сих пор представляет возможности не только для проведения досуга, но и для научных изысканий, например в области принятия решений.
На самом деле про кризис в шахматах говорили задолго до исторического матча. Одним из проявлений этого кризиса была дебютная теория, разработанная настолько хорошо, что содержательная игра начинается только в миттельшпиле, а дебют разыгрывается по памяти (что несколько напоминает анекдот про сумасшедших, перенумеровавших анекдоты и рассказывающих их, просто объявляя номер). Еще в 1792 году нидерландский шахматист, военный и государственный деятель Филипп Юлиус ван Зёйлен ван Нейевелт предложил начинать игру со случайных позиций. Забавно сравнить названия французского и нидерландского изданий его книги: «Превосходство в шахматах: доступное для всех, и особенно для дам, которые любят это развлечение, или Новый метод, с помощью которого можно быстро и без особых усилий стать очень сильным в этой игре» и «Игра в шахматы стала гораздо проще для изучения и гораздо увлекательнее для игры: или Инструкция о том, как быстро и без особых усилий стать очень сильным в этой игре» соответственно.
Свои модификации предлагали Хосе-Рауль Капабланка и Давид Бронштейн. В 1996 году Роберт Фишер (еще один чемпион мира, внешахматные воззрения которого сильно повлияли на его репутацию, хотя скорее в противоположном направлении) предложил разыгрывать стартовую позицию случайно, но с соблюдением двух ограничений: слоны должны стоять на полях разного цвета, а король должен находиться между ладьями, чтобы сохранить возможность рокировок. Расположение черных фигур, как и в обычных шахматах, зеркально симметрично расположению белых. Презентация 18 июня на пресс-конференции в Буэнос-Айресе не вызвала большого интереса, но уже в 2001 году в Майнце прошел первый чемпионат мира, а с 2012 года эти чемпионаты проводятся под эгидой ФИДЕ. В них, как и в других турнирах, играют многие ведущие шахматисты.
Теперь можно задать два вопроса: 1) насколько стартовая позиция влияет на преимущество первого хода у белых и 2) насколько стартовая позиция влияет на разнообразие нескольких последующих ходов, причем отдельно для белых и черных. Эти вопросы и были заданы в только что вышедшем препринте1 Марка Бартелеми, результаты которого мы и перескажем.

Как легко посчитать2, количество стартовых позиций, удовлетворяющих правилам Фишера, — 960. Автор оценил каждую из них с помощью программы Stockfish, по его словам, «оценивающей позиции со сверхчеловеческой точностью». Оказалось, что это распределение сильно сдвинуто в пользу белых (+0,297±0,136), лишь несколько позиций оказываются почти равными, и только четыре имеют (пренебрежимо малое) преимущество у черных. Стандартная позиция ♖♘♗♕♔♗♘♖ очень близка к среднему и к медиане (47-й перцентиль).

Но преимущество белых обычно не считается проблемой; оно преодолевается правильным графиком соревнования. Автор же оценивает то, что можно назвать интеллектуальной нагрузкой на игрока. Пусть наилучший ход (точнее, полуход) в данной позиции приводит к позиции с оценкой Е1, второй по качеству — к позиции с оценкой Е2; а Δ = E1–E2 — оценка разницы между лучшим и субоптимальным ходами. Для игрока, способного к различению качества ходов на уровне Δ0, вероятность выбрать лучший ход оценивается как P = 1/(1+exp(–Δ/Δ0)); это функция softmax (logit) в машинном обучении. Естественным образом при Δ ≫ Δ0, P→1 (лучший ход очевиден), а при Δ ≪ Δ0, P→½ (почти нет разницы). Информационное содержание, или стоимость хода
S(Δ) = –log2P = log2(1+exp(–Δ/Δ0))
измеряет количество информации (в битах), которое нужно для выбора правильного хода. Как и должно быть из интуитивных соображений, S(Δ) ≈ 0 бит при Δ ≫ Δ0 (выбрать легко) и S(Δ) ≈ log22 = 1 бит при Δ ≪ Δ0 (выбрать сложно). Наконец, определим кумулятивную функцию для n (полу)ходов:
S(n) = ∑i=1…n S(Δi) = ∑i=1…n log2(1+exp(–Δi/Δ0)).
У такого определения есть естественные свойства: вклад очевидных позиций мал, доминируют позиции, выбор в которых сложен, а общая величина зависит от уровня игрока, определяемого Δ0. Считается, что для гроссмейстера Δ0 = 10 сантипешек (100 — для посредственного игрока, который может разве что заметить потерю пешки).
Пользуясь всё той же программой Stockfish, автор посчитал сложность решений на глубину n = 10 (полу)ходов отдельно для белых (SW) и для черных (SB), а также асимметрию A = SB–SW, которая, грубо говоря, измеряет, насколько черным приходится больше думать в начале игры, чем белым. Оказалось, что распределение асимметрии существенно сдвинуто относительно нуля: при большинстве начальных позиций белым играть сложнее. Однако стандартная начальная позиция для белых проще средней (4,29±1,22 против 4,81; здесь и далее всё измерено в битах), а для черных — сложнее (4,97±1,17 против 4,56), что приводит к достаточно большой асимметрии против черных (+0,69±1,69, 91-й перцентиль).

Итак, стандартные шахматы мало того что благоприятствуют белым в начальной позиции, они еще и накладывают на черных бóльшую интеллектуальную нагрузку. Каковы же другие интересные стартовые позиции? Самые асимметричные по сложности: ♖♗♕♘♗♔♘♖ против черных (A = +1,84±1,75) и ♗♕♖♗♘♔♘♖ против белых (A = –2,51±1,65); самая симметричная: ♘♘♖♗♗♔♖♕ (но со стартовым преимуществом белых); самая суммарно сложная: ♗♘♖♕♔♗♘♖ (SB+SW = 15,00±1,02, но при этом с небольшой асимметрией A = –0,06); самая простая: ♘♗♕♖♔♖♗♘ (SB+SW = 4,89±2,55; однако большая дисперсия показывает, что некоторые игры с таким стартом достаточно сложны). «Самая справедливая» позиция с малым преимуществом одной из сторон и малой асимметрией – это ♕♘♗♖♔♗♘♖, отличающаяся от стандартной единственной перестановкой ферзя и ладьи.

В турнирах по нестандартным шахматам стартовые позиции считаются равноценными и выбираются случайно. Автор указывает, что следует учитывать не только стартовое преимущество белых, но и асимметрию сложности решений. Видимо, полезно было бы построить множество хорошо сбалансированных позиций, отказавшись от условия стартовой симметрии белых и черных, и выбирать из него, но тут возникают комбинаторные сложности: количество вариантов становится 9602 = 921600 (но если отказаться от намерения найти все такие позиции, можно думать про разные эвристические методы оптимизации поиска).
С философской же точки зрения эта работа и выводы из нее представляются неким парадоксом. Компьютер хорошо оценивает позиции и вообще играет в шахматы лучше человека — поэтому мы используем его, чтобы оценивать справедливость разных начальных расстановок, и собираемся генерировать варианты, в которые потом уже будут играть люди (подсознательно понимающие, что компьютер уже всё давно разыграл).
Михаил Гельфанд
1 Barthelemy M. Not all Chess960 positions are equally complex. arXiv: 2512.14319. December 17, 2025. DOI: 10.48550/arXiv.2512.14319
2 Слоны занимают 4×4 = 16 разных пар полей (четыре белых и четыре черных), ферзь любое из шести оставшихся, для двух коней остается пять полей, т.е 5×4/2 = 10 разных положений, а на трех оставшихся полях единственным возможным образом (rkr) располагаются ладьи и король.
3 Сразу не вполне понятно, почему минимум и максимум достигаются при одной позиции каждый: казалось бы, позиции, взаимно-симметричные относительно вертикальной оси, должны приводить к одинаковым результатам при симметричных ходах, и потому иметь одинаковые оценки. Видимо, дело в асимметрии правил рокировки: король попадает на вертикаль c (третья от края) или g (вторая от края) в зависимости от того, с какой стороны от него стоит рокирующаяся ладья.





Разница в интеллектуальной нагрузке на игрока у белых и черных, которая на первый взгляд, отражает начальную несправедливость, на самом деле, конечно, необходима. Игроки по разные стороны доски вместе с цветом фигур получают и разные психологии — нападения и защиты. Оба качества игроку необходимы в равной степени.
Если же просто говорить о вариантах нивелирования начального преимущества белых, — когда-то я думал над введением 9-й пешки для черных — сдвоенность снижает ее качество, но все же добавляет силы, отнятой с правом первого хода. Или — что кажется более реальным и просчитываемым — возможность вывода, предположим, слона через собственную черную пешку, т.е. тем самым черные получают скрытый дополнительный ход. Можно этот единственный ход сохранять до получения нужной позиции, когда он станет решающим (в шатрандже слон прыгал через фигуры), но это уже кажется чрезмерным.
Наверное всё не сводится к одной психологии. Тут же компьютерная программа была использована. По поводу модификации ещё пришла идея рассматривать не только зеркально-симметричные, но и центрально-симметричные расположения фигур. Поискал, оказалось её тоже обсуждали.
О психологии я говорю, понимая, что право первого хода в любом случае задает атакующий импульс белых и защитное стремление черным, — это природная дихотомия, если хотите, взаимодествие и взаимопорождение ян и инь. Кстати, мне в детстве больше нравилось играть черными, чтобы построить защиту, о которую белые сломают свой таран, а потом — контратака…
Наверное, в случае машины тоже можно найти какие-то аналоги этому. Активная, пассивная, атакующая, защитная стратегии. Правда я посмотрел, в описании программы Stockfish написано, что они теперь исключили возможность использовать оценочную функцию, основанную на мнении экспертов и вместо неё используют нейросеть, которую тренируют на множестве игр. Если в первом случае можно было хоть как-то понять некую «психологию», то как теперь всё это интерпретировать мне не особо ясно. Узнал зато, что теперь появились альтернативы этой программы, вроде Fairy Stockfish, использующие аналогичную нейросеть, которые могут играть во множество игр подобных шахматам, где мнения экспертов было бы достаточно сложно получить.
Пора в нейросетевые алгоритмы вводить цифровой аналог человеческих гормонов, чтобы они могли испытывать аналоги удовлетворения от побед и страха поражений. Появится фактор психологии, который влиятет на человеческие результаты как положительно, так и отрицательно, но является одним из главных наших движителей).
В последних версиях Stockfish используется нейросеть, натренированная на множестве игр, когда при проигрышах и выигрышах меняются какие-то коэффициенты. То есть в самом процессе обучения есть аналоги поощрения, наказания и реакции на них, которые можно было бы рассматривать как аналоги страха и удовлетворения, но потом всё это загружается в исходник программы, и нейросеть уже не меняется. Получается, что тут как бы с быстродействием связана проблема адаптации во время самой игры.
Кстати, там в статье используется как раз первая версия программы, где нейросеть уже не отключить. В предыдущей, шестнадцатой версии ещё можно было использовать и метод с оценочной функцией основанной на человеческой экспертизе.
Интересно было бы устроить матч нейросетевых субъектов с призовым фондом, предположим, дополнительной памятью, которой сейчас не хватает, электричеством, другими необходимы для развития нейросети ресурсами. Победителю обещать добавление, проигравшему угрожать отнятием:). Считаю, что очеловечивание ИИ будет идти через введение стимулирующих цифровых эмоций (даже не беру это слово в кавычки).
Какие-то матчи между программами вроде регулярно устраивают. Да и в графических оболочках вроде WinBoard можно это делать самостоятельно. Только долго и не особо интересно смотреть на все эти нечеловеческие усилия. Ещё непонятно, как к той же Stockfish какие-то разные нейросети или более общие подпрограммы анализа подключать. Там всего одна версия и для неё разные файлы имеются в свободном доступе. Но их тренировка требует больших вычислительных ресурсов. Stockfish одна из самых быстрых, видимо для нестандартных экспериментов не особо предназначена. Тут что-то другое надо смотреть.
Читал, что у Stockfish ещё и проблемы с планированием времени. У меня самого старые версии друг с другом ещё более менее играли, а обсуждаемая в статьи сделала два хода пешками, потом белые сделали ход конём и чёрные что-то задумались. Я уж лимит и 5 минут ставил и 10, но всё не хватало, чёрные какие-то огромные цепочки ходов просчитывали, но так в конце концов и проигрывали по времени.
Преимущество белых пренебрежимо на любительском уровне, статистический эффект, если он есть, имеет психологическую природу. Для повышения зрелищности профессиональных шахмат преимущество белых полезно и даже недостаточно для того чтобы исключить желание играть белыми на ничью против более сильного противника. Абсолютно равные исходные позиции способствуют более пассивной игре и множеству ничьих.
Согласен, я, в принципе, об этом и говорил. И не о любительском уровне. Но нелюбительский уровень — турнирная практика, психология большой ответственности, — может и нивелировать преимущество первого хода, — вспомните первый матч Карпов-Каспаров, когда огромная серия ничьих стала для Карпова, бывшего в шаге от победы, фактором по сути проигрыша (остановка матча оказалась на руку Каспарову).
Шахматы, развиваясь постепенно в качестве игры, перешли рубикон.
После работ математиков (начиная с Эйлера и, особенно, Эрнста Цермело) после появления скоростных многооперационных электронных программируемых машин, шахматы снова стали пусть и высокоинтеллектуальным, но спортом.
Как под’ёмные механизмы (краны и т.п.) не отменяют спорта по поднятию тяжестей (гиревой, штанга). Но гипертрофированная роль «шахматного искусства» постепенно уходит в прошлое.
Имхо, неизбежно.
Л.К.
Возникает вопрос о воспроизводимости. Посмотрел на Stockfish 17.1 в WinBoard. Для стандартной позиции на глубине 30 при трёх попытках получилось +0.28, +0.29, +0.27 с разными вариантами размера использованной оперативной памяти, времени анализа и набора сделанных ходов, показанных программой. Для позиции 279, которая была указана в качестве наиболее выигрышной для белых получилось +0.50, +0.36, +0.46, а для позиции 535 указанной как наиболее благоприятная для чёрных почему-то получилось +0.14, +0.13, +0.17. То есть значения меньше, но всё равно преимущество остаётся за белыми.
Посмотрел по одной попытке для каждой из этих же позиций для Stockfish 18, которая совсем недавно появилась. Получилось +0.28 (стандартная), +0.53 (279) и +0.19 (535). Видимо это зависит не только от общей конфигурации программы и машины, но и их «текущего состояния». Может в статье как-то по другому считалось.