Monday, March 19, 2018

an input of sovereign democracy

Наш (ass &  метричный) ответ вызову демократии:

Maxim Ananyev
22 hrs ·

Один из главных вкладов России в методологию политической науки -- это вклад в electoral forensics, статистические методы оценки манипуляций на выборах. С одной стороны, ЦИК публикует очень подробные результаты, а с другой -- уровень манипуляции оценивают как довольно высокий. Поэтому, например, многие работы в этой области основаны на российских данных.

Для интересующихся темой -- вот небольшой список популярных методов и reading list по ним.

1. Digits
Интуиция метода: если ряд чисел, например, явка на выборах по избирательным участкам, отражает какой-то “естественный” процесс, то распределение первых цифр, вторых цифр, последних цифр будет примерно соответствовать специальному вероятностному распределению -- распределению Бенфорда (Benford’s Law). Если люди вмешиваются в эти числа -- вбрасывают бюллетени, переписывают протоколы etc -- то распределение цифр начинает отклоняться от этого распределения. Это верно не только для ноликов и пятерок, но и для все остальных цифр тоже. Еще до электоральных исследований этот метод не без успеха применяли при анализе бухгалтерской отчетности крупных фирм.

Статьи по теме:
R.M. Fewster, “A Simple Explanation of Benford’s Law”, The American Statistician, 2009

W. Mebane, Jr, “Election Forensics: Vote Counts and Benford’s Law”, The Summer Meeting of Political Methodology Society, 2009

K. Breunig, A Goerres, Searching for electoral irregularities in an established democracy: Applying Benford’s Law tests to Bundestag elections in Unified Germany, Electoral Studies, 2011

2. Spikes
Это любимая народом “пила Чурова” -- всплески в распределении на круглых числах. Здесь нужно быть аккуратным, потому что сами по себе всплески на круглых числах могут возникать как результат целочисленного деления (это признают Кобак, Шпилькин и Пшеничников). Тем не менее в России во многих местах эти пики настолько высокие, что не могут объяснятся целочисленным делением. Это хороший метод, но его главная проблема уязвимость к фидбеку. То есть если сказать фальсификаторам: “не рисуйте круглые числа”, то пики уменьшатся, но это не означает, что уменьшится объем фальсификаций.

Статьи по теме:
D. Kobak, S. Shpilkin, MS Pshenichnikov, “Integer percentages as electoral falsification fingerprints”. The Annals of Applied Statistics, 2016

A Rozenas, “Detecting Election Fraud from Irregularities in Vote-Share Distributions”. Political Analysis. 2017

3. Mixtures
Это по сути продвинутый вариант любимых народом отклонений от нормального распределения в сторону мультимодальности. Этот метод предполагает. что в отсутствии манипуляций распределение голосов за “основную партию” должно следовать нормальному распределению. Отклонения могут объясняться двумя причинами: (1) “incremental fraud”, т. е. перераспределение небольшого количества голосов в пользу основоной партии или кандидата и (2) “extreme fraud”, т.е перераспределение примерно всех голосов. Таким образом, результаты на уровне уиков можно моделировать как смесь (“mixture”) распределений и оценивать вклад каждого их типов манипуляций в результат.

У этого метода есть как минимум два недостатка -- один решается просто, другой более серьезный. “Несерьезный” недостаток -- это аргумент про то, что у нас разнородная страна и даже в пределах одного региона могут быть места с разной ожидаемой явкой и разным уровнем поддержки власти (напрмер, город и село). Почему это не очень серьезный аргумент? Потому что в рамках этого метода никто не мешает моделировать ожидаемую явку не как константу в пределах региона, а как регрессионную функцию от набора параметров (в том числе, статуса “город-село”). Более интересное возражение такое: мультимодальность можно получить за счет стратегического голосования. То есть, например, за счет голосования “за любую другую партию кроме Единой России”. Насколько это сильное предположение в российских условиях -- зависит от контекста. Например, в ситуации, когда есть сильная оппозиционная кампания за “любую другую партию”, мы должны видеть больше такой мультимодальности в тех регионах, где живет больше оппозиционно настроенного населения. В ситуации когда такой кампании нет, мы должны видеть меньше многомодальности в “оппозиционных регионах”. В российских условиях, в условно “оппозиционных” регионах мы как раз видим что-то похожее на гауссовский колокол. Иными словами, вряд ли мультимодальность в России действительно объясняется стратегическим голосованием.

Статьи по теме:
W. Mebane Jr., “Election Forensics: Frauds Tests and Observation-level Frauds Probabilities”, Annual MPSA Meeting, 2016

K. Kalinin and W. Mebane Jr, "Worst Election Ever in Russia?”, Annual MPSA Meeting, 2017

4. “Метод Шпилькина”
Насколько я понимаю, в англоязычной литературе этот метод не описан (поправьте меня, если я ошибаюсь), но идея очень интересная. Мы предполагаем,что форма распределения “без манипуляций” -- это форма распределения за не-основную партию. Например, “за Яблоко”. У распределения голосов за другие партии может быть другая оценка матожидания и дисперсии, но форма зависимости голосов от явки должна быть похожая. Например, если распределение голосов за Яблоко - это колокол с средним на трех процентах, то у Единой России должен быть такой же колокол но со средним на других процентах. Отклонения в форме (например, длинный правый хвост) может означать манипуляции. У этого метода есть свои предположения, но он интересен именно тем, что -- несмотря на популярный образ Шпилькина как "пророка К. Ф. Гаусса в России" -- вовсе не предполагает изначально никакого “гауссовского” распределения. (P. S. В коментах юзер Misha Galashin поясняет за этот метод более аккуратно)

Статьи по теме:
С. Шпилькин, “Двугорбая Россия”, Троицкий Вариант, 2016

1 comment:

ba.ldei.aga said...

хотелось бы послушать начальника транспортного цеха:
взглянуть на распределения выборов, вызывающих доверие, польских, к примеру