Анализ украинских выборов
Apr. 20th, 2005 10:14 amАндрей Кунов, Алексей Ситников, Дмитрий Шакин "Россия и Украина: нерегулярные результаты регулярных выборов"
http://openecon.ru/news.asp?ob_no=713
http://openecon.ru/attach.asp?a_no=521
http://openecon.ru/news.asp?ob_no=713
http://openecon.ru/attach.asp?a_no=521
Re: страно что не ссылаются
Date: 2005-04-23 08:22 am (UTC)To bbb: Я хочу извиниться за то, что эта неприятная дискуссия развернулась в вашем журнале. Надеюсь, что этот мой пост ее закроет. Что касается вашей критики по поводу связи нерегулярностей и фальсификаций, то мой ответ таков: да, не все нерегулярности являются фальсификациями [хотя в статье в НГ, написанной без нашего ведома, их отождествили]. При этом, мы считаем, что нерегулярности (т.е. отклонения от свободного волеизъявления граждан) плохи, даже если они не являются фальсификациями, так как приводят к отклонению результата выборов от "свободного выбора". Именно поэтому, весь объем нерегулярностей оценивается нами в тексте статьи негативно (а не только те голоса из этого объема, которые были фальсифицированы). Про переток: если вы посмотрите на Литву, то там эта гипотеза (о перетоке к кандидатам второго тура) полностью подтверждается, хотя она не является _априорным_ предположением метода. А в России и на Украине -- это нарушается (хотя формально метод разрешает этому перетоку быть в честных рамках). Это и дает повод говорить о нерегулярностях и оценить их масштаб.
Дмитрий Шакин
Re: страно что не ссылаются
Date: 2005-04-23 01:21 pm (UTC)По форме - я не вижу в этой дискуссии ничего особенно неприличного. В ЖЖ нравы несколько проще и прямее, чем в формальной академической среде, излишней чопорностью здесь никто не страдает. Главное же - что разговор сразу переехал на содержательные проблемы.
Насчет отождествления нерегулярностей с фальсификацией: журналист НГ в целом адекватно пересказала вашу работу, и если она допустила такое отождествление (а я знаю и других, понявших вас именно таким образом) - значит, проблема не столько на ее стороне, сколько на вашей. Вы не могли не понимать, что эта проблема слишком политизирована, чтобы не задумываться о таких возможных интерпретациях. Я уже процитировал МОШ - сарказм в английском тексте очевиден, его восприятие, ведущее к упомянутому отождествлению так же очевидно. Даже сейчас вы прямо говорите, что нерегулярность - это плохо, то есть вносите оценочные категории, заранее зная, что есть "правильное волеизъявление", а что нет. Мне, читателю ваших текстов, это вовсе не так очевидно.
Про переток в Литве - я посмотрю это внимательнее в понедельник (бумаги остались в офисе).
Re: еще раз простите
Date: 2005-04-23 03:20 pm (UTC)Как Вы знаете, в 1993 году физик А. Собянин объявил, что ратификация новой Российской Конституции была фальсифисирована. Основания для такого утверждения были чисто математические, построенные на каких-то формулах. Собянин объяснял что фальсификации следуют из отклонения результатов выборов от какого-то всеобщего закона. По этому закону, две партии (два кандидата), не могут получить слишком близкое число голосов. Если же они получают близкие результаты, значит это фальсификации. Так, зная результаты выборов для любой страны (из энциклопедии), Собянин брался немедленно выявить фрод и его подсчитать. Буквально, получив из аудитории пять цифр, Сан Саныч чертил два графика на доске – офиц результаты и ожидаемые из его закона, и объявлял, что отклонения двух линий есть свидетельство фальсификаций. Тут же, «на оборотной стороне конверта», подсчитывал милионные фальсификаций. Это было бы смешно, если бы это не было так важно для будущего нашей с вами страны. Через несколько лет Собянин умер, и от Собянинских расчетов осталась только красивая легенда, что кто-то как-то доказал факт фальсификаций в 1993 году. Эта легенда перекочевала во все учебники российской современной политической истории. Теперь ужен икто не помнит и не знает почему Собянин сделал такой вывод, но все помнят что Российская Конституция была фальсифисированна и это было доказано. Значит эта Конституция нелегитимна. А согласитесь, Дмитрий, это очень опасно для страны в которой мы с вами живем. Ведь в случае серьезного политического кризиса, именно этот аргумент может стать решающим обоснования в глазах населения отказа от Конституции. Тот или иной политик, с экрана телевизора объявит об своих неконституционных действиях, мотивируя необходимость новой Конституции, потому что прежняя была фальсифицированна и это было доказано учеными. Теперь вот Вы заявили что для Ющенко фальсифицировали голоса, но меньше чем Януковичу. Представляете как это может быть использованно противниками Ющенко в Украине – нет, не сейчас, когда все помнят как это было, а через пять лет или десять. Согласитесь, надо быть очень осторожным с выводах и с анализом. Принять во внимание как политики прочитают ваш текст.
Такой длинный пост, и все то для того что бы призвать вас обсудить вашу работу. И начать с обсуждения точности вашего метода для выявления нерегулярностей. Насколько велика ошибка вашего вашего метода для выявления нерегулярностей – так сказать ошибка первого и второго рода. А уже если мы знаем нерегулярности, насколько точны могут быть оценки фальсификаций полученные на основе установленных нерегулярностей. Ведь вы говорите только о нерегулярностях, не о фроде – я это понимаю. Но важно оченить не только точность вашего метода оценки нерегулярностей, но и точность возможных попыток делать на основании неругулярностей выводов о фальсификаций. И просто здорого, что вы не согласны с интепретацией данной журналисткой НГ. А давайте здесь обсудим «правильную» интепретацию вашей работы и вы сами опубликуете это в НГ ! Или, хотя бы давайте здесь, в журнале bbb попытаемся сохранить дисскусию этой правильной интепритации – так что у будущих историков российской политики будет возможность получить данные из первых рук.
Re: еще раз простите
Date: 2005-04-23 05:21 pm (UTC)1) Собянин и Суховольский - http://www.hrights.ru/text/sob
2) Филиппов и Ордешук против Мягкова и Собянина - http://www.demokratizatsiya.org/Dem%20Archives/DEM%2005-01%20filippov.pdf
Re: еще раз простите
Date: 2005-04-23 05:22 pm (UTC)1) Собянин и Суховольский - http://www.hrights.ru/text/sob
2) Филиппов и Ордешук против Мягкова и Собянина - http://www.demokratizatsiya.org/Dem%20Archives/DEM%2005-01%20filippov.pdf
3) Ответ Собянина - http://www.geocities.com/CapitolHill/2568/s_reply.html
Re: еще раз простите
Date: 2005-04-24 08:02 am (UTC)Если бы внимательно прочитали аналитический доклад с нашего сайта, то несомненно бы поняли, что все наши утверждения о наличии нерегулярностей основаны на проверенной нами их статистической значимости. Я вообще на понимаю (как математик), как можно что-либо утверждать о статистически незначимых результатах. Так, превышение перетока над 100% наблюдается и в Литве (например, 102% от Пауласкаса к Паулаускасу), но при обсуждении этого момента тексте указано, что это отличие не является стастически значимым (найдите это место и убедитесь). А вот в России и на Украине это превышение является значимым (даже на 99% уровне -- прочитайте текст и убедитесь, что там это сказано). Как я написал в своем первом посте, в КСШ сделан упор именно на статистическую аккуратность результатов. Но при этом заметил, что работа в этом направлении еще продолжается. Все таблицы перетоков (каждый коэффициент) будут сопровождены доверительными интервалами. Сейчас они там не приведены, но при этом весь разговор ведется только о _статистически значимых_ нерегулярностях (по-другому и быть не может). Что касается статистической значимости ПДИ, то тут вообще разговор о значимости идет на каждом шагу. Даже карты построены не по точечным оценкам, а по квантилям распределения, которые как раз и показывают статистическую значимость.
Что касается публикаций в прессе, то мы (Андрей Кунов и я) дали интервью изданию Gazeta.ru (оно должно быть согласовано с нами и появится, я думаю, через неделю), где мы изложили свои результаты, сделав особый упор на то, что нерегулярности не должны отождествляться с фальсификациями. Кроме того, рассказывая о наших результатах на крглом столе, Андрей Кунов и Михаил Мягков потратили довольно много времени для того, чтобы сделать упор на этом разграничении.
Дмитрий Шакин
P.S. Вы утверждаете, что понимаете, что мы не отождествляем фальсификации и нерегулярности. Тогда как я должен относиться к вашей фразе "Теперь вот Вы заявили что для Ющенко фальсифицировали голоса, но меньше чем Януковичу." Где это заявлено? В КСШ слово фальсификации вообще употребляется только для передечи мнений других людей, решения Верховного Суда Украины и определении нерегулярностей (как один из возможных случаев неругулярностей).
Re: еще раз простите
Date: 2005-04-24 02:42 pm (UTC)Я знаю что Вы хороший математик. Сам я не математик, но был обучен тому что обсуждать можно только статистически значемые результаты. Однако я так и не понял ваш ответ на мой вопрос – какова статистическая значимость конкретной оценки основных (обобщенных) выводов вашей модели – например в МОШ вы оцениваете 14.5 млн голосов за Путина как нерегулярные – но не приводите никакой статистики для этой оценки (например доверительный интервал). По крайне мере этого нет в моей копии статьи. Возможно ревьюеры уже попросили вас ставить статистику в заключительный вариант, тогда я просто не информирован. Так и какова же значимость этой цифры? И других обобщенных цифр.
PS Здорово что вы решили быть особенно акуратными с интерпретацией результатов. Но между прочим, доступная мне копия вашей работы in Post-Soviet Affairs (МОШ 2005) включает абстракт заявляющий что 'Our secondary objective is to measure the extend of electoral fraud, and here we conclude that Putin's success at avoiding a second round vote against his communist challenger in 2004 was aided and abetted by upwards of 14.5 million falsified ballots and that between 1.5 and 3.5 million suspicious votes account for Yanukovich’s ill-fated November “victory”.” Вы с этой фразой из абстракта согласны?
Re:
Date: 2005-04-24 05:41 pm (UTC)Вообще, мне малопонятно ваше болезненное желание ("Была какая-то особая причина не собщать статистическую значимось ваших оценок?") найти какую-нибудь методологическую неточность, пропущенное слово и т.п. Должен вам прямо сказать, что вы не там ищете -- вряд ли вы сможете уличить нас в каких-либо статистических махинациях (хотя вам, я вижу, очень хочется). Я же вам сказал в предыдущем посте, что мы рассуждаем _только_ о _значимых_ нерегулярностях. В ответ на это вы у меня опять спрашиваете (в другой форме): а являются ли ваши результаты статистически значимыми (типа я из вашего ответа этого так и не понял)? Вам моего заверения мало? Может вам просто любопытно? В этом случае, подождите финальной версии.
Дмитрий Шакин
P.S. Ревьюеры говорите? Так их же вроде не было? Или вы "просто не информированы"? По поводу вашего PS - обратитесь к Питеру (на правах его большого друга и советчика) или Михаилу (вы ему очень нравитесь), которые писали английский текст. Я готов вам ответить (как писавший текст КСШ всесте с Андреем Куновым и Алексеем Ситниковым) по поводу любых терминологических замечаний в тексте КСШ. Правда скажу, что сделаю этого без особого желания -- ваш интерес к этой дискуссии заключается в попытках хоть как-нибудь обосновать свое первое высказывание "все это бред", а вовсе не в _конструктивном_ разговоре о методах.
Дмитрий Шакин
методология анализа
Date: 2005-04-24 08:41 pm (UTC)Re: методология анализа
Date: 2005-04-25 05:31 am (UTC)дальше, тем более странные вещи приходтся слышать. Вы, я посмотрю,
считаете себяи знатоком Ecological Inference? Так я вам отвечу. Метод
который мы используем, является новым (если нет -- буду рад, если вы
приведете мне работу, в которой он уже был употреблен). Он является
обобщением недавнего метода Chambers and Steel (2001). Это вы
называете старым методом? Мы использовали и другие методы (как вы их почтительно назвали более трудоемкие), которые гарантируют попадание коэффициентов в отрезок [0,1]. Например, мы взяли метод Г.Кинга (он вам, как знатоку EI должен быть хорошо известен). Да он загнал все коэффициенты куда нужно, но при этом получилось [мы его применяли для перетока между парламентскими выборами -- в нашей предыдущей работе], что Единая Россия получила почти в 3 раза больше голосов, чем у нее было в действительности. В частности, Она получила 68% голосов Единства-99, 66% голосов Отечества-99, 63% КПРФ-99, 91% голосов ЛДПР-99, 89% СПС-99, 93% Яблока-99, 31% неголосовавших-99, 90% других партий-99. В сумме - 57% от общего числа избирателей (реально она получила 21% от общего числа избирателей). В отличие от Г.Кинга, наш метод дал для этого перетока адекватный результат, очень близкий к соц.опросам. Какой из этих методов мы должны в итоге использовать?
Что касается вашего поста про рапределения, то это вообще перл. "Но, на мой вгляд из графиков видно, что второй горб статистически незначим – статистически все распределения выглядят как обычные нормальные распределения." Вот это -- действительно бред. В отличие от вас я [в последний раз] объясню, почему это бред. Как вы можете, сами признавшись, что не знаете какой метод мы используем, не видя наших данных, утверждать на основе визуального(!) анализа, что наш результат статистически(!) незначим. Я не знаю, где вы обучались статистике, но уверен, что если вы покажете этот пост своему бывшему преподавателю, он пересмотрит вашу оценку по этому предмету (хотя, возможно, у вас и так была двойка).
Что в итоге я получил из дискуссии с вами? Вы неуклюже ущипнули метод ПДИ, безосновательно обрушились на статистическую значимость всех методов, упрекнули нас в использовании устаревших методов EI (возможно, я что-то пропустил). При этом ни одно из ваших замечаний не оказалось в итоге по существу, а лишь выявило (1) ваше невнимательное прочтение работы и (2) вашу низкую квалификацию в рассматриваемых рассматриваемых областях статистики. В связи с этим, это мое сообщение будeт последним моим ответом на ваши реплики.
Без всякого уважения,
Дмитрий Шакин
Re: метод Фоменко
Date: 2005-04-25 02:26 pm (UTC)Re: еще раз простите
Date: 2005-04-24 03:09 pm (UTC)Вот, смотрите, параграф 4.2:
Однако, мы хотим не только подтвердить широко известные факты нерегулярностей в этих частях Украины, но и убедится в честности победы Ющенко в третьем туре.
Ниже мы посмотрим, убедились вы в этом или нет.
Весьма просто найти причины, зачем сторонникам Ющенко мог понадобиться этот дополнительный "горб".
Эта фраза, с учетом слова "понадобиться", может читаться только как рассуждение на тему "зачем ющенковцы устроили фальсификацию"
Предположим (на секунду), что выборы были действительно честными. Если мы наблюдаем рост явки между первым и третьим турами в западных регионах, где сконцетрированы избирателиЮщенко, то это означает, что его сторонники стали активнее голосовать. Аналогичный вывод о сторонниках Януковича можно сделать рассмотрев восточные регионы. Как же в этом случае выходит, что в тех районах, где население примерно поровну разделилось между кандидатами, произошло снижение явки? Единственный вывод, который напрашивается из этого рассуждения заключается в том, что либо на западе, либо на востоке (либо и там, и там) избиратели шли на выборы под давлением.
Если бы вы написали "предположим на секунду, что второй тур был честным", то эта фраза, действительно, НЕ обязательно могла бы интерпретироваться как ваше признание фальсификации в третьем туре. В нынешнем же виде она уравнивает второй и третий туры. Читатель НЕ МОЖЕТ НЕ ПОНЯТЬ ее так, что во втором туре имела место фальсификация в пользу Януковича, а в третьем - в пользу Ющенко.
Как видно, в Донецкой области Янукович получал в среднем 1,06 голоса в свою поддержку от каждого дополнительно приходящего на участок избирателя, в то время как Ющенко терял 0,06 голоса. Такая ситуация кажется невероятной при честных выборах, ведь один избиратель не может принести более одного голоса. В Львовской области ситуация еще более ярко выражена: каждый дополнительный избиратель приносит 1,33 голоса в копилку Ющенко. Не стоит однако забывать, что базовым условием применимости нашего метода является однородность регионов, потому на рисунках 5 и 6 отдельно показаны городские и сельские районы, которые значительно отличаются друг от друга по явке. Если провести анализ отдельно для сельских и городских комиссий, то результаты по прежнему остаются нерегулярными.
Что это означает? Что во Львовской области было то же, что и в Донецкой. А так как в Донецкой области имело место нечто, что, вашими же словами, кажется невероятной при честных выборах, то вывод из ваших слов однозначен - во Львовской были такие же фальсификации.
И, наконец, ваши выводы:
Украинские выборы прошли в условиях так называемой конкурентной фальсификации. Оба кандидата прибегали к давлению на избирателей, что отражалось в результатах голосования на востоке и западе страны. Во втором туре более успешными были манипуляции лагеря Януковича, которые принесли кандидату от власти почти 2 млн. "дополнительных" голосов, в то время как Виктор Ющенко приобрел лишь 700 тыс. таких избирателей. Однако уже в третьем туре преимущество принадлежало Виктору Ющенко, в лагерь которого пришло 1 млн. 700 тыс. нерегулярных голосов.
Здесь вы прямо объявляете фальсификацию (с малопонятным добавлением "конкурентная") характеристикой украинских выборов вообще, без разделения на туры, а второй и третий туры рассматриваете просто как разные проявления этой фальсификации.
Так что вынужден прямо сказать - для любого читателя, кроме разве что прослушавшего ваши разъяснения, ваш текст вполне однозначно утверждает, что третий тур на Украине сопровождался массовыми фальсификациями.
Наконец, не могу не обратить внимание на то, что "нерегулярность" - это термин новый, неустоявшийся (по крайней мере, в русском языке). НЕ рассматривать его как политически корректный эвфемизм слова "фальсификация" - читателю очень трудно. Если вы не хотели, чтобы такое прочтение имело место - то вынужден вас огорчить, своей цели вы не достигли.
Re
Date: 2005-04-24 05:42 pm (UTC)1) Термин "нерегулярности" вводится в самом начале статьи (не считая введения). Там явно указано, что нерегулярности не равны фальсификациям.
2) Далее везде в статье речь идет нерегулярностях (в частности, честные выборы -- выборы без нерегулярностей, нечестные -- с нерегулярностями). Замечу, что даже в обычном русском языке слово "нечестный" не равно "противозаконный". Да, мы считаем нерегулярные выборы нечестными, так как их результаты не соответствуют свободному волеизъявлению граждан в рамках изложенных в статье моделей. Слово фальсификации к результатам наших методов далее в тексте не употребляется [единственное неосторожное употребление -- про "конкурентные фальсификации" -- мы, я полагаю, уберем. Если вы приведете еще такие неаккуратные высказывания -- я буду вам признателен]. Со всеми вашими выводами из цитат работы я полностью согласен, если заменить слово фальсификации на нерегулярности. В частности, во Львовской области, как и в третьем туре наблюдались _нерегулярности_. Во истину так.
3) Однако, мы, как авторы, не можем нести ответсвенность, если, несмотря на явное указание в начале, читатель продолжает отождествлять в своей голове фальсификации и нерегулярности. Несмотря на это, чтобы избежать недоразумений, цитирование этой предварительной версии запрещено без разрешения авторов (см. первую страницу).
Все проблемы с пониманием текста [по моему мнению] связаны с тем, что люди либо не читают наше разъяснение о нерегулярностях, либо читают его невнимательно [извините, уважаемый bbb, если этим высказыванием я вас причислил к одной из этих категорий]. Мы не можем ориентироваться на них при написании и сопровождать каждое употребление слова нерегулярности сноской с фразой "это не всегда фальсификации, см. определение".
Возможно, вы были бы за такие сноски, но, уверен, вы понимаете и мою точку зрения.
Дмитрий Шакин
P.S. В заведении ЖЖ я не вижу смысла, так как надеюсь, что господа типа federalism'a не будут очень активно лить грязь на наши исследования в будущем.
Re: Re
Date: 2005-04-24 09:58 pm (UTC)В академической среде, если ваш оппонент недостаточно внимательно прочитал ваш текст и проглядел какие-то тонкости - это проблемы оппонента. В публицистике - это проблемы ваши, авторов. Политическая жизнь - это не мой ЖЖ, у вас там не будет возможности объяснить двадцать раз, что вас, мол, недостаточно внимательно читали и неправильно поняли. Журналисты, публицисты, политики - не ищут первоисточники. В их мире статья в НГ - достаточное основание, чтобы прямо говорить о фальсификациях и т.д.
В свое время я тоже приглядывался к результатам украинских выборов (см. http://www.livejournal.com/users/bbb/1119159.html и линки в постинге), и мое ощущение, что анализ ОТНОСИТЕЛЬНЫХ цифр дает в данном случае результаты не просто менее убедительные, чем анализ цифр АБСОЛЮТНЫХ, но в определенных случаях прямо-таки misleading (см. мою дискуссию с юзером hina_chlek).
Кстати, вы можете ко мне обращаться по-простому, по имени, как все другие люди. Оно не секретное :)
Re: Re
Date: 2005-04-25 05:54 am (UTC)В чем я с вами совершенно согласен, так это в том, что в журнале "Эксперт" ее в нынешнем виде публиковать не стоит :) -- мы и не собираемся, как не собирались это делать в НГ.
Дмитрий Шакин
Re: Re
Date: 2005-04-25 02:07 pm (UTC)Проблема в том, что он УЖЕ СТАЛ элементом публицистики и не мог не стать, и вы, положа руку на сердце, не могли не понимать, что он станет таковым. Берясь за такую тему, вы не могли ожидать, что обсуждение вашего доклада ограничится узким кругом профессионалов.
Мое предложение было бы - сделать такие разъяснения (насчет того, что нерегулярность не есть фальсификация) более отчетливыми и развернутыми, выделить их шрифтом, повторить в предисловии и заключении. Это во-первых. Во-вторых, мое предложение - еще раз присмотреться к приведенным мной цитатам, из которых, повторю, для читателя практически однозначно следует вывод, что вы таки отождествляете нерегулярность с чем-то очень подозрительным, short of falsification.
Я могу пояснить, в чем я вижу здесь проблему. Дело в том, что в факте систематических фальсификаций в обсуждаемых выборах я практически не сомневаюсь. Но отождествление ваших "нерегулярностей" с фальсификацией позволяет дискредитировать само предположение о наличии фальсификаций, увести обсуждение в ложном направлении.
хорошая новость - плоды междисциплинарного обсуждени
Date: 2005-04-26 09:42 pm (UTC)Во вторых, сегодня я узнал, почему иногда метод Кинга не работает – как, по мнению Дмитрия, в случае российских выборов в 2003. Оказывается, это известная проблема излишнего агрегирования при использовании метода Кинга – я узнал это от нашего эконометрика, за ланчем (думаю, что ему можно доверять – он пишет с Кингом, да и факультет, благодаря ему входит в десятку сильнейших в стране по методологии, согластно последнему рейтингу US World Report). Для анализа перехода нельзя использовать гетерогенные данные. Для того чтобы метод Кинга работал, надо разбить данные на несколько более гомогенных групп. Например, для России, на федеральные огруга, а еще лучше на группы, сравнимые с Литвой. И считать отдельно по группам. Правильно примененный, метод Кинга гарантирует что странности замеченные при анализе перехода, исчезнут. Таким образом, и вторая нерегулярность снимается.
Что касается графиков распределения (горбов), то здесь мы пока не можем воспроизвести результаты. Похоже все-таки, что графики распределия за Януковича во втором раунде и Ющенко в третьем статистически одномодальны, что bumps о которых вы говорите всего лишь зрительная иллюзия и, статистически не значимы. Более того, пока попытка воспроизвести графики в STATA для Украины никаких бампов не показала. Олег сказал мне, что скорее всего было использованно конкретное сглаживание, очень чуствительное к выбору параметров (бинов). Пока, не зная эти параметры, и детали используемых данных, я получаю совершенно нормальные графики, без всяких бампов.
Re: еще раз простите
Date: 2005-04-24 03:10 pm (UTC)Re: еще один вопрос
Date: 2005-04-24 06:00 pm (UTC)