15 ноября 2020 года в Молдове прошел второй тур президентских выборов, на котором победила Майя Санду с результатом 57,72% (51.96% внутри страны). Мы решили проверить, насколько национальное самоопределение граждан коррелирует с их электоральными предпочтениями.
Считается, что этнические молдаване или люди, самоопределившиеся как румыны более склонны голосовать за правого кандидата. Однако, были предположения, что на последних выборах эта зависимость ослабла. Мы решили проверить статистическими методами, так ли это.
Типичный метод метод проверки корреляции — это расчет корреляции Пирсона для двух переменных, в нашем случае это будет процент голосов за Санду в регионе и процент молдован и/или румын на этой же территории согласно переписи 2014 г. Важными являются два показателя — это, собственно, корреляция Пирсона и P-значение.
Первый показатель может принимать значение от 0 до 1, где 0 — это полное отсутствие связи, 1 — полностью пропорциональная зависимость. Знак показателя указывает на то, зависимость прямая или обратная.
P-значение, грубо говоря, указывает на статистическую значимость результата. Чем оно меньше, тем результат значимее. Значения меньше 0,05 считаются значимыми
Мы подсчитали эти показатели и составили графики. Результаты нас удивили.
Корреляция голосов за Санду и процентом молдаван и румын на территории
Корреляция Пирсона между результатом Майи Санду на территории и процентом самоопределившихся как молдаване или румыны составила 0,81. Это весьма сильная корреляция, которая нечасто встречается в социальных науках. P-значение составило < ,001, что дает значимый результат.
Это говорит о весьма сильной склонности молдаван и румын голосовать за Санду относительно других этнических групп.
Взгляните на график ниже. Там по оси X сумма жителей региона, самоопределившихся как молдаване или румыны в процентах, по оси Y — процент голосов за Санду в регионе. Каждая точка представляет собой показатели того или иного района, синяя линия — график идеального случая, когда зависимость прямо пропорциональная.

Крупные территории, Кишинев, Гагаузия и Бельцы, лежат довольно близко к синей линии, что подтверждает правильность подсчетов — чем больше регион, тем ближе значение в нем должно быть к среднему.
Корреляция голосов за Санду и процентом молдаван (без румын) на территории
Если учитывать только определившихся как молдаван, сила корелляции несколько падает, но все же остается довольно высокой. Корреляция Пирсона составляет 0,71, P-значение растет, но все же остается меньше < ,001:

Любопытно, что Кишинев отдаляется от средней линии, это говорит о том, что самоопределившиеся как молдаване более склонны голосовать за Санду, чем в среднем по стране.
Корреляция голосов за Санду и процентом румын на территории
В этом случае результат несколько точнее, чем для результата с учетом только молдаван, но не дотягивает до точности совместного показателя. Корреляция Пирсона составляет 0,76, P-значение также меньше < ,001.

Кишинев и Гагаузия отдаляются от средней линии. Для Гагаузии это обусловлено низким процентом самоопределившихся как румыны (0,04%), для Кишинева тем, что в силу каких-то факторов румыны менее склонны голосовать за Майю Санду в среднем по стране, что, в прочем, компенсируется процентом Молдаван проголосовавших за нее.
ВЫВОДЫ:
- На выборах 15 ноября 2020 г. наблюдалась четкая прямая связь между национальным самоопределением и процентом голосов за Майю Санду (и, соответственно Игоря Додона). Наиболее сильная корреляция с голосами Санду получается если суммировать показатели самоопределившихся как молдаване и румыны.
- Предположения о преодолении внутри страны связанности электоральных предпочтении с этничностью кажутся преждевременными. Электоральные предпочтения остаются сильно связанными с национальной самоидентификацией.
- Один из наиболее типичных регионов по данным показателям — Бельцы.
- Кажущийся аномально низким результат Майи Санду по Гагаузии (5,41%) по сути не является таковым, и обусловлен низким числом молдаван и румын в регионе.
ДАННЫЕ:
- Результаты выборов: https://pv.cec.md/cec-template-presidential-results.html
- Данные об этническом составе территорий: https://statistica.gov.md/pageview.php?l=ro&idc=479
- Датасет и алгоритм подсчета:
Александр Ламбов