«Как исследовать электоральные фальсификации?»

Начало нового электорального цикла 2011-2012 годов ознаменовалось ростом протестных настроений в российским обществе, вызванным многочисленными разоблачениями электоральных фальсификаций. Обвинения, прозвучавшие в адрес властей, подкреплялись большим количеством разнообразных свидетельств нарушений в виде протоколов, рассказов очевидцев и статистическим анализом электоральных данных.

Кирилл Калинин
Кирилл Калинин

 В данной статье PhD Candidate факультета политологии Мичиганского Университета (Анн Арбор, США), преподаватель РЭШ Кирилл Калинин рассказывает об исследованиях фальсификаций и основных ограничениях, с которыми сталкиваются подобного рода исследования. Он также рассматривает эффективность косвенных методов оценки фальсификаций, а именно отечественных социологических опросов и экзит-поллов. Кроме того, в его статье речь идет о том, как можно объяснить «пиковые» фальсификации наблюдающихся на «круглых» значениях явки или голосования.

 

 

 

См. также:

 

Популяризация исследований электоральных фальсификаций в России не уникальна: к примеру, после президентских выборов в США 2000 года, отличившихся своей неоднозначностью, вышла целая масса статей научного и публицистического жанров, ставящих под сомнение официальные результаты выборов. Иными словами, как правило, сформировавшийся общественный запрос на подобного рода исследования, приводит и к возникновению предложения со стороны экспертного сообщества.

К сожалению, современной наукой пока не придумана сколько-нибудь идеальная методика, способная вскрыть факты электоральных фальсификации, а тем более измерить их масштаб. Разумеется, если бы подобная методика была придумана, то она непременно стала бы объектом внимания фальсификаторов и их ответных действий по ее девальвации. Поэтому исследование электоральных фальсификаций – это всегда игра на опережение деятельности «фальсификаторов». Если же «фальсификаторы» опережают исследователей, то последним остается только разочарованно разводить руками.

Допустим, применительно к России, централизованный сбор и обработка электоральной статистики с помощью системы ГАС «Выборы» может способствовать не только быстрому получению электоральной статистики, но и координации усилий по манипулированию электоральной статистикой. Допустим, в случае присутствия подобной координации многочисленные методы выявления фальсификаций окажутся неэффективными.

Основная проблема исследования фальсификаций заключается именно в том, что сами по себе фальсификации сложно выявить и доказать: не все наблюдающиеся статистические аномалии могут быть сведены только лишь к фальсификационному объяснению. Далее я остановлюсь на двух способах исследования электоральных фальсификаций: анализе данных электоральной статистики и статистических данных, собранных в ходе полевых экспериментов, опросов и экзит-поллов.

 

Анализ данных электоральной статистики

 

Графики одномерных распределений

При анализе данных электоральной статистики многие исследователи-блогеры на своих сайтах и блогах оценивают наличие и масштабы электоральных фальсификаций, выстраивая графики одномерных распределений (иными словами, гистограммы) для явки и голосования. При этом они исходят из того, что эмпирические данные обязательно должны описываться с помощью «нормального» гауссовского распределения, которое, действительно в данном измерении считается эталонным, хотя и не единственным в своем роде.

Так, обнаружение любых расхождений между гауссовским «нормальным» распределением и наблюдаемым распределением, с их точки зрения свидетельствуют о явном присутствии электоральных фальсификаций. Для явки это допущение обычно правдоподобно (допустим, в той же Мексике, Польше, Болгарии наблюдаются схожие распределения) (См. График 1а). Однако при построении подобных графиков для голосования нормальное распределение, как правило, отсутствует (См. График 1b).

 

«Как исследовать электоральные фальсификации?»
График 1а. Распределение избирательных участков по явке (с сайта http://esquire.ru/elections)

 

«Как исследовать электоральные фальсификации?»
График 1b. Распределение избирательных участков по голосованию для Канады и Германии
«Как исследовать электоральные фальсификации?»
График 1с. Распределение избирательных участков по голосованию для России, 2011

Как правило, одномерные графики исключают из рассмотрения множество факторов, которые могли бы объяснить наблюдаемые аномалии: принадлежность участков к областям или республикам, городам или селам и т.д. Иными словами, использование одномерных распределений игнорирует многомерный характер данных, вписывая их только в одно измерение.

Эта проблема напоминает один сюжет из «Флатландии» Э. Эбботта, согласно которому сфера, проходившая через двумерное пространство, представлялась его обитателям в виде изменявшей свои размеры окружности. Если говорить более определенно, то существование участков со стопроцентной явкой может объясняться наличием малых поселений, гарнизонов, тюрем, больниц. К примеру, при взвешивании явки по количеству проголосовавших на каждом участке избирателей большая часть аномального пика в области 100% явки исчезает (См. Графики 2 и 3).

 

«Как исследовать электоральные фальсификации?»
График 2. Распределение избирательных участков по явке для думских выборов 2003-2011 (невзвешенная)
«Как исследовать электоральные фальсификации?»
График 3. Распределение избирательных участков по явке для думских выборов 2003-2011 (взвешенное)

 

Однако, при этом в демократических странах, данные по которым у нас имеются, пиковые значения явки все-таки отсутствуют.

Двумерные графики Другим немаловажным способом выявления фальсификаций служит установление взаимосвязи между явкой и голосованием, которая определяется регрессионным или корреляционным анализом, а визуально представляется в виде двумерных графиков (впервые подобного рода анализ был представлен в работах А. Собянина и В. Суховольского, а затем М. Мягкова и П. Ордешука). Обоснование подобного рода графиков простое: при положительной взаимосвязи между явкой и голосованием можно говорить о вбросах, а наличии отрицательной за оппозиционные партии – о перебросах (См. График 4).

Несмотря на, казалось бы, безупречный характер данного метода, имеется и ряд существенных ограничений. Во-первых, вполне возможно, что наблюдаемая взаимосвязь между явкой и голосованием объясняется упомянутой мной неоднородностью данных. Этот аргумент подтверждается примером других стран, где просматривается похожие зависимости. Во-вторых, не исключено существование категорий избирателей с различной активностью участия в выборах. В-третьих, при выстраивании регрессионных моделей взаимозависимость между явкой и голосованием, как правило, приводит к неверным результатам регрессионного анализа, и требует более сложных статистических моделей.

 

«Как исследовать электоральные фальсификации?»
График 4. Доля голосов за партии от числа зарегистрированных избирателей в зависимости от явки для Германии (2009) и России(2011).

Распределения цифр Иные методы диагностики электоральных фальсификаций учитывают распределения вторых или последних значащих цифр в числах проголосовавших избирателей. К примеру, согласно закону Бенфорда теоретическое распределение вероятностей второй значащей цифры (перевернутой логарифмической функции) числа, должно совпадать с наблюдаемым распределением, в том случае, если числа взяты из реального мира. Данный закон доказал свою надежность в электоральной диагностике применительно к различным национальным контекстам, однако согласно недавним исследованиям У. Мебейна, применение данного метода осложнено требованиями учета специфики избирательной системы исследуемой страны.

Альтернативный подход концентрируется на исследовании последних значащих цифр в числах проголосовавших избирателей. Согласно ему, если бы числа проголосовавших избирателей отражали совокупность естественных процессов, побуждающих людей к голосованию или отказу от голосования, то последние значащие цифры в числах должны характеризоваться равномерным распределением. Так, Таблица 1. показывает, что распределение последних значимых цифр в наблюдаемых числах проголосовавших избирателей с 2003 по 2012 гг. значимо отличается от равномерного распределения.

Таблица 1. Распределение последней значащей цифры в числах проголосовавших избирателей на федеральных российских выборах 2003-2012 гг.

2003

2004

2007

2008

2011

2012

Цифра

Р

О

Р

О

Р

О

Р

О

Р

О

Р

О

0

6.2

3.0

9.9

4.7

10.5

7.7

15.4

10.5

11.4

5.6

7.9

2.5

1

−2.0

0.1

−1.8

1.3

−0.8

0.1

−1.4

−0.7

-2.9

-1.0

-2.6

0.2

2

−0.6

−0.4

1.1

0.5

−1.3

1.7

−2.1

−0.2

0.9

-2.7

1.5

-0.3

3

−1.2

−1.0

−1.8

−0.7

−0.6

−1.4

−1.9

−2.1

-0.5

-1.3

-1.6

-1.3

4

0.7

−0.3

−3.3

−0.8

−3.4

−1.0

−3.7

−1.3

-3.8

1.2

-0.8

-0.9

5

3.1

0.9

2.1

3.3

2.1

−0.2

2.7

0.8

1.3

0.4

0.7

1.3

6

−1.8

−0.9

−0.1

0.0

−2.8

−1.8

−1.3

−1.1

-2.9

0.6

-0.6

-0.4

7

−0.2

0.9

−2.0

−2.2

−1.1

−0.9

−3.1

0.0

-1.6

0.2

-1.1

1.1

8

−0.7

−1.5

−0.7

−2.1

−0.3

−0.8

−1.4

−1.0

-0.3

-1.1

-2.1

-0.6

9

−3.5

−0.8

−3.4

−4.0

−2.3

−3.5

−3.2

−4.9

-1.5

-1.8

-1.3

-1.5

69.9

15.4

137.2

60.9

144.2

82.0

292.2

143.0

169.9

47.33

83.3

14.6

n

17,008

77,305

17,600

77,824

17,875

77,928

17,865

78,383

17732

77435

12021*

53513*

 

В Таблице 1. указаны соответствующие каждой цифре, находящейся на последней позиции числа, знаковые корни статистики хи-квадрат, где нулевая гипотеза подразумевает равномерное распределение последней значащей цифры в числах проголосовавших избирателей в УИКах.  показывает суммарную статистику хи-квадрат с 9 степенями свободы, т.е. общую сумму квадратов отклонений за год, n – общее количество УИКов (для Р-республик, и О-регионов, * – предварительные расчеты, на данный момент не все данные выложены на сайте избиркома).

В случае, если абсолютное значение табличного числа равно или превышает 2.0, можно говорить о наблюдающемся существенном расхождении, т.е. числовых аномалиях. Наблюдается весьма любопытная тенденция: в числах проголосовавших избирателей (т.е. в явке) всегда слишком велико количество нулей и пятерок, но при этом – явный недостаток девяток. Примечательно, что согласно суммарной статистике Xи-квадрат, выборы 2011 и 2012 гг. оказываются более «чистыми» по сравнению, скажем, с 2007 и 2008гг.

 

Анализ данных опросов, экзит-поллов и полевых экспериментов.

Общим для всех этих методов является использование выборочного метода, с помощью которого производится случайный отбор респондентов и участков. Важное достоинство косвенных методов измерения фальсификаций – возможность собрать большое количество данных об отобранных случайным образом респондентах и участках. Наличие подобных данных позволяет более убедительно доказать теории/гипотезы о наличии фальсификаций, или, наоборот, их опровергнуть (в отличие от данных электоральной статистики по всем участкам, данных о которых может оказаться недостаточно для того, чтобы наделить аномалии ярлыком «фальсификаций»). Главная сложность – техническая реализация случайного отбора респондентов, избирателей или участков, обеспечивающего репрезентативный характер выборки, а также наличие суммарной ошибки.

Полевые эксперименты позволяют оценить уровень электоральных фальсификаций, сравнивая средние результаты выборов по двум типам отобранных случайным образом участков: участков, в которых специально подготовленные наблюдатели смогли зафиксировать серьезные нарушения, и участков, в которых нарушения не были зафиксированы. Если полевой эксперимент, реализованный проектом «Гражданин Наблюдатель» на декабрьских выборов 2011 года смог установить масштаб электоральных фальсификаций в пользу ЕР по Москве равный 12%, то на мартовских выборах подобного рода масштабных фальсификаций выявить не удалось: разница между средними результатами по двум группам участков составила 1.2%, не выходя за пределы статистической погрешности.

Полевые эксперименты могут быть подвержены влиянию различных факторов, снижающих их точность. Начиная с проблемы соблюдения качества случайного отбора участков в Москве (закрытые участки не охватываются экспериментом) и интересов самих «фальсификаторов» в сокрытии фальсификаций на отобранных участках (в случае, если номера отобранных участков им стали заранее известны), и, заканчивая интересами самих наблюдателей, которые изначально могут преследовать цели противоположные эксперименту.

Косвенным методом оценки электоральных фальсификаций, как правило, служат предвыборные рейтинги и электоральные прогнозы, основанные на опросах, проводимых отечественными социологическими службами. Многие небезосновательно сетуют на то, что разговоры о массовых фальсификациях, в целом по стране противоречат данным экзит-поллов и опросов, проведенных согласно научным методам сбора и анализа данных. И наоборот, сторонники фальсификационной парадигмы, как правило, обвиняют социологические организации в предумышленном искажении электоральной статистики.

Начиная с 90-х гг. социологические организации всегда довольно успешно справлялись с расчетами рейтингов и прогнозов, однако при этом существовали и продолжают существовать ряд обстоятельств осложняющих работу социологов. С одной стороны, речь может идти о повсеместным использовании нерепрезентативных выборок, в которые отбираются только легкодоступные респонденты, с другой стороны, практике переписывания анкет самими интервьюерами.

Наконец, наиболее важным фактором, на мой взгляд, влияющим на качество политических опросов служит фактор «лживости» самого респондента, предпочитающего давать социально-одобряемый ответ на вопрос о том за кого он собирается проголосовать. К примеру, согласно предварительным результатам недавнего опросного эксперимента проделанного мной совместно с Левада-Центром для предвыборной кампании 2012 года среди избирателей собирающихся принять участие в выборах, доля тех, кто по тем или иным соображениям говорит неправду о своих истинных предпочтениях в отношении одного из кандидатов составляет порядка 15%. Безусловно, подобного рода искажения отчасти могут развязывать руки «фальсификаторам», стремящимся достичь «спрогонозированного» результата.

Наконец, экзит-поллы сталкиваются с теми же проблемами: существуют проблемы случайного отбора участков, проблемы отказов (опрашиваются только те респонденты, которые согласились принять участие в экзит-полле, но не опрашиваются «отказники», которые, возможно, имеют отличные политические предпочтения от согласившихся принять участие в опросах). Основным, тем не менее, фактором искажающим результаты социологических опросов и экзит-поллов является стремление многих респондентов давать социально-одобряемые ответы, которые суммарно дают завышенный процент поддержки кремлевских кандидатов или партии власти, и заниженный оппозиции.

 

Объяснение электоральных фальсификаций на президентских выборах 2000-2008.

Наличие пиков на «круглых» значениях явки и голосовании за партию власти (некоторые блогеры такую шероховатость в распределениях окрестили «бородой Чурова»), служит, на мой взгляд, веским аргументом в доказательстве о наличии или отсутствии фальсификаций. Согласно нашему анализу, наблюдающиеся пики на «круглых» значениях явки статистически значимы, иными словами, возможность их случайного возникновения исключена. Отмечу, что на протяжении 2000-х в России отмечался довольно устойчивый их рост именно на «круглых» значениях явки (См. Графики 2,3).

Теоретическое объяснение данному наблюдению нам удалось разработать в Мичигане совместно с Волтером Мебейном. Согласно нашей игровой модели, рост политической централизации власти в России способствовал изменению рациональных стратегий губернаторов: если в середине 1990-х отношения между политически автономными губернаторами и Кремлем выстраивались в виде торга, в рамках которого благоприятные электоральные результаты обменивались на политические/экономические ресурсы, то последующая политическая рецентрализация 2000-х побудила губернаторов к смене своих стратегий на сигнальные.

Сигнальные стратегии подразумевают использование фальсификаций на «круглых» значениях явки в качестве сигнала о лояльности отдельно взятого губернатора. Подобный сигнал вознаграждается большими межбюджетными трансфертами со стороны Кремля, а также гарантиями политического выживания губернаторов. Основные теоретические выводы данной модели были подтверждены результатами анализа эмпирических данных президентских выборов 1996, 2000, 2004 и 2008 гг.

 

Резюме

Исследование электоральных фальсификаций –  трудоемкая процедура, подразумевающая разработку методов анализа данных и построение объяснительных теорий электоральных фальсификаций. Ее успешная научная реализация невозможна без последовательного исключения альтернативных объяснений наблюдающимся статистическим аномалиям. До тех пор пока «аномалии» не прошли через эти жернова научного метода, сложно говорить о какой бы то ни было научной обоснованности электоральных фальсификаций.

Анализ данных электоральной статистики, как правило, ограничен отсутствием информации об аномальных участках для тестирования альтернативных гипотез. Косвенные методы доказательства фальсификаций, как правило, приходят им на помощь, однако они имеют свои сложности реализации, в том числе связанных с нежеланием большинства респондентов раскрывать свои истинные электоральные предпочтения.

Подписаться
Уведомление о
guest

7 Комментария(-ев)
Встроенные отзывы
Посмотреть все комментарии
rwalk
rwalk
12 года (лет) назад

Очень тяжело и коряво написано. Кроме того, текст плохо отформатирован. По-видимому, первый абзац после таблицы представляет собой подпись к ней — если так, то и таблица и подпись к ней должны были бы быть размещены после абзаца, начинающегося со слов «Альтернативный подход концентрируется…», а не до него.

Совершенно непонятна фраза «согласно закону Бенфорда теоретическое распределение вероятностей второй значащей цифры (перевернутой логарифмической функции) числа, должно совпадать с наблюдаемым распределением, в том случае, если числа взяты из реального мира» — тут и с содержанием и просто с согласованием падежей проблемы.

Что такое «знаковые корни статистики хи-квадрат»?

И т.д.

Наташа
Наташа
12 года (лет) назад
В ответ на:  rwalk

Уважаемый rwalk,
форматирование — не вина автора, поменяли 14 марта, переставили таблицу на нужное место. Приносим свои извинения за ошибки в верстке.

Burrdozel
Burrdozel
12 года (лет) назад

Полевой эксперимент, говорите?

Ну провёл я полевые эксперименты и 4 декабря, и 4 марта.

Унёс домой свой бюллетень.
В результатах УИК, опубликованных на соответствующем сайте, сколько выдано бюллетеней- столько и обнаружено.
Если прибавить к этим цифрам те, что у меня дома- общее количество бюллетеней превышает то количество, что было в распоряжении УИК согласно протоколу.
Результат абсолютно достоверный, никаких косвенных домыслов и интерпретаций.
И выборы в Думу, и выборы президента проведены с грубейшими нарушениями.

Причем обсуждать бюллетени и процедуру голосования- бессмысленно.
Результаты формируются где-то (видимо, в ГАС Выборы) без связи с реальными протоколами. Ни разу не слышал о том, что кто-нибудь потрудился собрать все протоколы УИК одной ТИК и сопоставить результаты.

И еще. Наличие пиков на «круглых» числах в процентах косвенно подтверждает ГАС-версию фальсификаций. Ведь чтобы выйти на суммарные проценты в помощью фальсификаций протоколов, надо очень точно считать и вбрасывать недостающее количество бюллетеней. Уровень подготовки тётенек на УИКах вызывает сомнение в таких сложных действиях.
Другой дело- рисовать результаты в обратном порядке: начала пишем число 60%, а потом под него подгоняем данные протоколов в системе, а потом оформляем протоколы. Бюллетени НИКТО пересчитывать не будет- нет ни одного известного факта (кроме скандала с участком Митрохина, причем был ли тогда пересчет на самом деле- неясно).

Naukarus
Naukarus
12 года (лет) назад
В ответ на:  Burrdozel

С фальсификациями по стране, по регионам и даже по городам, очень неравномерно. Причем используются разные типы, и вбросы, и переписывания протоколов, и просто ввод данных под заданные показатели. Но самое главное, есть УИКи, ТИКи и даже целые города или районы города без фальсификаций, что позволяет собственно оценить результат честного подсчета (выборы при этом все-равно фальсифицированные, поскольку выборы это не только подсчет голосов).

Pavel
Pavel
12 года (лет) назад

1) Не сказано про анализ дисперсии результатов внутри ТИК — у Бориса Овчинникова (barouh) есть ряд исследований на эту тему. Это позволяет обнаружить аномалию, когда соседние участки голосуют совершенно по-разному. Слишком большая дисперсия явным образом свидетельствует о фальсификациях.
2) Следует указать, что в Канаде мажоритарные выборы (308 округов), ведь они сильно отличаются от пропорциональных, где голосуют за партийный список, а не за кандидатов от округа.
3) Необходимо упомянуть о всплеске на 0% для всех партий, кроме ЕР. И далеко не всегда это соответствует 100% за ЕР (хотя 100% тоже невозможны при нормальной организации выборов). Это один из ориентиров при поиске регионов с фальсификациями.
4) Объём фальсификаций в Москве (12%) сильно занижен — ведь у «Гражданина наблюдателя» получилось 30% за ЕР для более-менее чистых участков, а реальный показатель должен быть ещё ниже — около 25% (при официальных 47%). Это подтверждается экзит-поллом ФОМ, КОИБами и двумерной гистограммой явка-голоса (центр чистого кластера — 25%). Отчёт ГН можно почитать на Эхе у Орешкина в статье «Об изящных искусствах».
5) Уместно упомянуть о том, что очень близкие к Гауссу распределения были получены в мартовской Москве как для явки, так и для голосов. Известно также, что в Москве удалось избежать крупных фальсификаций в отличие от декабря.

Pavel
Pavel
12 года (лет) назад

6) Корреляцию явки и результата также можно использовать для расчёта объёма фальсификаций. Корреляция наблюдается во многих странах, но в некоторых регионах России она имеет аномальный вид — после некоторого порога явки она становится очень сильной и меняет тренд. Дмитрий Кобак (kobak), основываясь на гипотезе, что такая корреляция должна быть монотонной (т.е. не должна менять знак) находит порог явки для каждого региона и выкидывает «аномальные» участки. Искать по словам «kobak порог явки» и «oude_rus 15 курьезных фактов о выборах».

Pavel
Pavel
12 года (лет) назад

7) Один из наиболее эффективных методов оценки объёмов фальсификаций — сравнение результатов на участках с КОИБ с соседними участками, где КОИБ нет (участки берутся из этого же ТИК). Оказывается, что на участках с КОИБ результат ЕР существенно ниже (Исследование Сергея Шпилькина — podmoskovnik.livejournal.com/134962.html). При этом не стоит забывать, что результаты КОИБ также частично сфальсифицированы (особенно на Кавказе), и то, что КОИБ нередко ставили на окраине города (где результаты ЕР выше). Единственная сложность метода — данные о том, где установлены КОИБ, приходится собирать вручную.