Математика выборов-2011: дополнение

trv-science.ru

12 лет назад

Редакция «Троицкого варианта» попросила меня прокомментировать статью Сергея Шпилькина, обратив особенное внимание на слабые места в его аргументации. Поскольку мне таким образом предлагается выступить в роли адвоката дьявола, спешу предупредить читателя о своей позиции. У меня нет сомнений в том, что эти выборы проходили с огромными фальсификациями в пользу партии власти: этому есть масса документальных свидетельств. Как и С. Шпилькин, я считаю, что статистический анализ результатов может помочь оценить масштаб этих фальсификаций и прикинуть настоящие результаты. По разным оценкам, настоящий результат «Единой России» составляет 30-40 %; моя собственная оценка — 38 % [1].

Сделав это необходимое предисловие, перехожу к комментариям.

1. Перечень слабых мест начну с одного из сильных. Единственное неоспоримое из статистических свидетельств фальсификации — это резкие пики на гистограмме голосов за ЕР: на детализированных гистограммах видны резкие пики каждые 5 %, начиная с 65 % (на всякий случай замечу, что на 50 % резкого пика, хорошо заметного на некоторых графиках, на самом деле нет — это артефакт целочисленных распределений). Вероятность случайного возникновения таких регулярных пиков астрономически мала [2], и они особенно сильны в таких регионах, как Башкортостан и Северная Осетия. Под этими пиками находится около миллиона дополнительных голосов за ЕР, что их итоговый результат меняет не очень сильно (примерно на 1 %). Но зато никаких сомнений в рукотворном происхождении пиков быть не может: мы видим разнарядку по результатам голосования.

2. С остальным сложнее. Все методы оценки масштаба фальсификаций построены на том, что корреляция между явкой и результатами ЕР считается результатом вбросов и приписок. Действительно, во многих странах и явка распределена более или менее нормально (см. рис. 2 в статье С. Шпилькина), и корреляции между явкой и результатами нет. Но есть и страны, где в честности выборов сомневаться не приходится, а картина тем не менее напоминает ситуацию в России: видна четкая корреляция между явкой и результатами разных партий. Среди них Англия [3], Германия [4] и Израиль [5].

Особенно интересен пример Германии: указанная корреляция практически исчезает, если перейти к рассмотрению отдельных земель, т.е. странности на общенемецких графиках и распределениях возникают из-за сильной неоднородности регионов. Россия — огромная и очень неоднородная страна; есть все основания предполагать, что даже при кристально честных выборах эта неоднородность могла бы привести к «подозрительным» корреляциям. Тем не менее, С. Шпилькин в своей статье анализирует всероссийские данные целиком.

На самом деле, если проводить анализ по каждому региону в отдельности, то выясняется много интересного: в каких-то регионах корреляции нет, а явка распределена в аккурат по Гауссу (но результаты ЕР в каждом из таких регионов разные). В каких-то регионах официальные результаты явно не имеют отношения к действительному волеизъявлению граждан (Чечня с явкой выше 99,5 %; Владикавказ с результатом ровно 75 % за ЕР почти на каждом участке; Дагестан, где количество голосов за ЕР на десятках участков кратно ста [6]). Но в каких-то регионах мы по-прежнему видим четкую корреляцию между явкой и голосами за ЕР. Можно ли считать опасение исчерпанным?

3. К сожалению, нет. Кроме разницы между регионами есть еще как минимум одна важная неоднородность: традиционно сильная в России разница между городом и селом. Именно на эту разницу ссылались В. Чуров и соавторы в своей статье с критикой подхода С. Шпилькина [7]. Если и явка, и поддержка партии власти на селе выше, чем в городе (а и то, и другое представляется вполне вероятным), то рассмотрение региона целиком покажет корреляцию при отсутствии причинной связи. Пользуясь названиями территориальных избирательных комиссий, можно примерно разделить городские и сельские участки внутри каждого региона.

Если это проделать, то картина станет еще интереснее: выясняется, что во многих регионах корреляция между явкой и результатом ЕР целиком обязана селу: город голосует компактно, демонстрируя вполне разумные значения явки и результата за ЕР, а вот на селе явка меняется в широком диапазоне, и чем она выше — тем выше результат у ЕР. Таковы, например, Воронежская, Омская и Ульяновская области. Этому возможны два объяснения. Первое: разделив страну на регионы и выделив город и село, мы устранили все важные неоднородности; оставшиеся корреляции — это признак подтасовок. Второе: село в этих областях действительно так голосует. Допустим, в этих регионах на селе поддержка ЕР очень высока, но явки на разных участках сильно различаются и зависят, к примеру, от активности местных агитаторов. В таком случае чем больше придет народу — тем больше будет результат ЕР. Можно ли как-то опровергнуть эту попытку объяснения? Чисто статистически это вряд ли возможно, но остается надежда на КОИБы.

4. Увы, но с КОИБами всё тоже не так однозначно. Есть регионы, где достаточно много КОИБов было установлено на селе и при этом участки с КОИБами тоже демонстрируют высокую корреляцию между явкой и результатом ЕР (не все регионы таковы, но именно так обстоит дело, например, в Брянской и Саратовской областях). Что это: свидетельство об истинной природе голосования на селе или о том, что в этих областях фальсификаторы то ли не боялись КОИБов, то ли просто пересчитывали результаты вручную, на что они имели полное право? То, что КОИБы не являются панацеей от фальсификации, ясно показывают примеры Дагестана или Тувы, где участки с КОИБами спокойно демонстрируют неправдоподобный уровень явок.

С другой стороны, в Москве результат ЕР по участкам с КОИБами значительно ниже, чем в целом по городу. Но если посмотреть на географию этих участков повнимательнее, то выясняется, что они в основном сконцентрированы всего в трех районах города (Митино, Строгино и Зеленоградский район) и, таким образом, не могут считаться репрезентативной выборкой [8]. В Петербурге все КОИБы и вовсе были установлены в Кронштадте — в сущности, в другом городе. Наконец, необходимо быть очень осторожным при объединении результатов из разных регионов: разница между результатом ЕР на участках с КОИБам и без КОИБов в пределах одних и тех же ТИК (здесь я следую очень разумному подходу С. Шпилькина) в среднем по регионам составляет всего лишь порядка 6 %. Это явно свидетельствует о подтасовках на участках без КОИБов, но о довольно скромных. Гигантская разница, о которой пишет С. Шпилькин (между 37 и 54 %), возникает только при объединении всех регионов, что кажется не вполне корректным.

5. Наконец, о точности разных оценок несфальсифицированных результатов. Метод Шпилькина дает 34 %. Этот же метод, примененный к каждому региону по отдельности, дает в итоге 32 % [9]. Метод, основанный на отсечении участков с явкой, превосходящей некоторую границу,— снова 34 %. Если для каждого региона устанавливать отдельные границы для города и села, то в итоге получится 38 % [1]. Наконец, предварительные результаты экзит-полла ФОМа (в окончательных результатах есть резон сомневаться) составили 43 % при 30 % отказавшихся ответить респондентов, — очень условно можно считать, что если бы эти люди ответили, у ЕР получилось бы процентов 40. Настоящий результат, по всей видимости, лежит в границах, очерченных этими числами.

В заключение — о приятном. Благодаря работам С. Шпилькина статистический анализ результатов выборов всего за несколько дней после 4 декабря буквально взорвал русскую блогосферу (см. с. 9). Посмотрите на список цитат к этой короткой заметке: почти все они — записи в бло-гах самых разных людей из разных стран мира, которые сообща в кратчайшее время проделали огромную работу по анализу итогов выборов. Такому слаженному и эффективному сотрудничеству могла бы позавидовать любая международная научная коллаборация. Надеюсь, эта работа будет продолжаться [10].

Дмитрий Кобак,
аспирант в Imperial College London

1. http://kobak.LivejournaL.com/101512.html

2. http://kobak.livejournal.com/102646.html

3. http://users.livejournal.eom/_ab_/139002.html

4. http://jemmybutton.livejournal.com/1359.html

5. http://levrrr.livejournal.com/31427.html

6. http://gegmopo4.livejournal.com/72536.html

7. Чуров В.Е., Арлазаров В.Л., Соловьев А.В., Итоги выборов. Анализ электоральных предпочтений: http://cikrf.ru/banners/illuziya/itogi_160908.html

8. http://oude-rus.livejournal.com/551503.html

9. http://dmitrykogan.livejournal.com/46452.html

10. Шень А. Выборы и статистика: казус «Единой России» (2009, 2011). www.lif.univ-mrs.fr/~ashen/elections.pdf