В конце октября в Москве состоялся хакатон, посвященный анализу данных криминальной статистики, организованный проектом «Открытая полиция» Комитета гражданских инициатив при поддержке Генеральной прокуратуры РФ.

Сам термин «хакатон» (англ. «hackathon» — от «hacker» и «marathon», буквально — «хакерский марафон») вошел в обиход в конце 90-х годов и означал непродолжительное — от одного дня до недели — мероприятие, на котором специально собравшаяся команда программистов в режиме мозгового штурма решала какую-либо нетривиальную хакерскую задачу. Позднее понятие расширилось, и вышло далеко за рамки программирования, так что сейчас хакатоном называется мозговой штурм, в котором принимают участие программисты, дизайнеры, менеджеры и представители других профессий, в результате создавая программы, сайты или другие продукты, решающие поставленную задачу.

В данном случае задача была сформулирована максимално широко — проанализировать массив необработанной криминальной статистики, понять, какую полезную информацию из нее можно извлечь, и создать на ее основе продукты, полезные как правоохранительным органам, так и всему обществу. Мероприятие проходило в формате конкурса, в котором приняли участие 12 команд (в т.ч. одна из Петербурга и одна из Татарстана), а призовой фонд составил 45 тыс. руб.



Исходные данные предоставила Генеральная прокуратура РФ, в ведение которой некоторое время назад было передана от МВД статистическая деятельность, а начальник управления правовой статистики ГП РФ Олег Инсаров возглавил жюри конкурса.

Участникам было предложено три набора данных:
  • Официальные данные криминальной статистики по двум районам Республики Татарстан — полностью актуальные, но, в соответствии с требованиями закона, деперсонализированные (исключены персональные данные участников инцидентов, а адреса мест событий огрублены с точностью до улицы).
  • Данные криминальной статистики города Москвы за 2011-2015 гг., собранные вручную финансовым аналитиком Андреем Екимовым из ежегодных отчетов и аналитических записок районных ОМВД (всего 125), окружных (всего 11), ГУВД города Москвы, отчетов межрайонных прокуратур, расшифровок видеозаписей заседаний муниципальных советов, на которых отчитывались руководители районных отделов МВД, публикаций районных газет.
  • Наборы данных портала безопасныедороги.рф. Информация о дорожно-транспортных происшествиях с пострадавшими на дорогах федерального, регионального и межмуниципального значения, предоставленная МВД России.
При этом участники могли самостоятельно использовать любую другую дополнительную статистику, которую только посчитают нужным.

Необходимо отметить, что подобный хакатон на криминально-статистические темы проводился в стране впервые. Дело в том, что до недавнего времени за сбор и анализ данных о преступности отвечало МВД, и процедура была далека от совершенства. С одной стороны, у перегруженных работой следователей зачастую не доходили руки тщательно заполнять множество полей в регистрационных карточках, и при их последующем анализе и переводе в электронную форму обнаруживалось множество «белых пятен». С другой — результаты деятельности самого ведомства оценивались по таким параметрам, как раскрываемость преступлений, и потому его сотрудники зачастую были заинтересованы в том, чтобы какие-то события в статистику попросту не попали. Излишне говорить, что сами массивы данных широкой публике доступны не были, а отдельные вырванные из контекста цифры озвучивались в пресс-релизах.

Передача статистического учета и анализа в ведение Генеральной прокуратуры выглядит вполне логично. Мало того, что ее сотрудники не заинтересованы в искажении информации, так в функции ведомства входит еще и надзор за деятельностью полиции. И достоверная информация о том, что где-то низка раскрываемость, а где-то слишком много дел не доходит до суда, может послужить отправной точкой для проведения прокурорских проверок.



Как сообщил на открытии мероприятия г-н Инсаров, Генпрокуратура, раскрытая для хакатона информация по двум районам Республики Татарстан представляет собой своеобразный пилот. В будущем данные, собранные по всей стране и представленные в аналогичной форме, будут размещены в открытом доступе на сайте ведомства. Что же до полноты и достоверности первичной собираемой информации, то в настоящее время идет работа над автоматизированным рабочим местом (АРМ) следователя. Вместо заполнения бумажных карточек от руки сотрудники полиции будут вводить информацию непосредственно в базу данных, и система просто не примет неполного отчета, а необходимые для делопроизводства бумажные документы будут формироваться при этом автоматически, что избавит следователей от излишней бумажной работы.

Поскольку задача хакатона была сформулирована максимально широко, подготовленные участниками проекты получились весьма разными как по тематике, так и по реализации. Вот некоторые наиболее интересные из них.

Идея наложить криминальную статистику на карту и проанализировать распространенность тех или иных видов преступлений на местности оказалась привлекательной для трех команд. При этом две команды использовали в качестве исходного массива статистическую подборку по Москве, собранную Андреем Екимовым. Ее достоинством является намного большее общее число случаев, что дает некоторую свободу при использовании статистических методов, а недостатками — неполнота (информация по многим районам попросту отсутствует) и очень грубая — всего лишь с точностью до городского района — географическая детализация.

В результате получились две довольно похожие друг на друга работы, наглядно сравнивающие уровень преступности в разных московских районах как в абсолютном выражении, так и в расчете на 100 тыс. населения. Эта информация может оказаться полезной покупателям недвижимости и риэлторам — хотя, безусловно, была бы еще полезнее, если бы на полученных картах примерно половина территории города не была бы окрашена в серый цвет из-за отсутствия данных. Одна из этих команд, вдобавок, исследовала связь уровня преступности с уровнем образования, информация о котором бралась из находящихся в открытом доступе рейтингов учебных заведений. Увы, никакой корреляции между этими показателями обнаружено не было.

Третья команда, «Юр-IT-ик», в своем проекте-прототипе «Маршрут без опасности» использовала данные Генпрокуратуры по Татарстану. Хотя общее число криминальных событий, произошедших в сельской местности с января по август 2016 г., невелико, географическая привязка с точностью до улицы дала возможность для более детального анализа — тем более, что формат представления данных позволяет автоматически сортировать их по разным уголовным составам, а также отделять уличную преступность от внеуличной.



По замыслу создателей прототипа, на интерактивную карту наносятся уже совершенные уличные преступления, наиболее актуальные для граждан, разделенные на четыре основных категории:

1. Убийство, покушение на убийство, а также причинение тяжких телесных повреждений, приведших к смерти потерпевшего («могут убить»).
2. Изнасилование, сексуальные действия насильственного характера («могут изнасиловать»).
3. Причинение телесных повреждений различной тяжести («могут избить»).
4. Разбой и грабеж («могут ограбить»).

Эти данные наносятся на интерактивную карту, что позволяет сравнивать криминальную обстановку «под лупой». По замыслу авторов проекта, в число его потенциальных потребителей попадают граждане (получающие возможность выбора не только спокойного района проживания, но и более безопасного маршрута по городу), полиция (для организации уличного патрулирования), местные власти (например, с целью определения географии установки камер наблюдения) и общественные организации, занимающиеся профилактикой правонарушений. В качестве бонуса команда проанализировала, какие именно материальные ценности чаще всего становились объектами имущественных преступлений.

Команда под названием «За тобой выехали» представила проект «Индикатор эффективности работы региональных МВД». Исследование состояло из трех этапов. Сначала на основе открытых статистических данных были определены регионы с наибольшим числом зафиксированных правонарушений в области оборота оружия и незаконного оборота наркотиков. Лидерами по оружию ожидаемо оказались кавказские республики, а по наркотикам — Челябинская и Свердловская области, Республика Башкоторстан, а также Красноярский край и Кемеровская область.



На втором этапе по обеим категориям для каждого региона была подсчитана доля дел, дошедших до суда. Обнаружилось, что с наркотикам наихудшим образом обстоят дела в Ненецком и Чукотском автономных округах (до суда доходит лишь 26.8% и 28.0% дел соответственно). По оружию же вырисовалась весьма причудливая картина: в «лидерах» оказались все тот же Ненецкий АО (18.2% дел, дошедших до суда) и Республика Тыва (17.1%), однако протянувшийся по карте «красный пояс» охватил вполне мирные охотничьи таежные регионы — Хакасию, Иркутскую область, Бурятию, Амурскую область, Хабаровский и Приморский края, Магаданскую область и Камчатку — там доля дел, дошедших до суда, варьировалась от 21% до 40%. Вторым «красным» очагом на карте оказались также традиционные охотничьи регионы на Северо-Западе России — Рекспублика Коми, Вологодская и Архангельская области, Карелия, Мурманская область.

Наконец, на третьем этапе авторы проанализировали, в каких регионах менее всего доходят до суда дела о взятках. Здесь в чемпионах оказались Чукотка, Магаданская область, Сахалин и Еврейская АО, хотя неблагополучная картина складывается и в ряде других мест. Сравнивая эти показатели, удобно представленные на визуализации, можно попытаться сделать выводы, в каких регионах органы внутренних дел работают наименее эффективно,а также где эта неэффективность может объясняться коррупцией.

Правда, в ходе защиты проекта, авторы не смогли сколько-нибудь убедительно объяснить «оружейную» аномалию в охотничьих регионах, включая и те, где ситуация с наркотиками и коррупцией вполне благополучна. В ходе дальнейшего обсуждения вероятное объяснение было найдено. Как выяснилось, авторы даже были не в курсе, содержалась ли в использованных ими источниках информация только об уголовных преступлениях или об административных правонарушениях тоже.

В отличие от дел о взятках и незаконном обороте наркотиков, огромное количество нарушений в области оборота оружия относятся не к уголовному, а к административному составу, который влечет наложение штрафа или даже всего лишь вынесение предупреждений во внесудебном порядке. Если дело именно в этом, то все становится на свои места: например, охотник, проживающий в отдаленной таежной деревне, не успел вовремя добраться до райцентра, чтобы перерегистрировать свое охотничье ружье; инспектор разрешительного отдела вынес ему предупреждение, и правонарушение попало в базу, а до суда оно не дошло и не могло дойти. Занимаясь анализом данных, относящихся к какой-либо предметной области, мало виртуозно владеть статистическими методами, необходимо хотя бы минимально в ней разбираться. Тем не менее, проекту было присуждено третье место — после устранения недостатков предложенная в нем методика вполне может быть принята на вооружение Генпрокуратурой.



Еще одной иллюстрацией о необходимости хотя бы минимального владения предметной областью стал проект, в котором авторы, помимо прочего, анализировали долю оправдательных приговоров, выносимых российской судебной системой. Она оказалась исчезающе мала. Однако, как известно, в России весьма значительное число уголовных дел рассматривается в особом порядке, когда обвиняемый под давлением собранных улик признает себя виновным еще на стадии предварительного следствия, чтобы получить смягчение наказания. Вынесения вердикта о виновности или невиновности при этом не производится, а суд сводится к вынесению приговора. Вполне логично было бы рассматривать долю оправдательных приговоров только для дел, рассматриваемых в общем порядке, когда суд, в первую очередь, определяет именно виновность подсудимого. Однако ничего подобного сделано не было; как выяснилось — авторы вообще не знали о такой особенности российского законодательства.

Очень интересным и совершенно нестандартным проектом, получившим внеплановый специальный приз жюри, оказалась онлайн-игра «Симулятор судьи», построенная на реальной судебной статистике, почерпнутой из открытых источников. Игроку представляются реально вынесенные приговоры по реальным уголовным делам, где излагаются обстоятельства совершенных преступлений, а потом предлагается самостоятельно вынести приговор, обозначив срок лишения свободы. После этого раскрывается срок, вынесенный по данному делу в реальности — так что есть возможность сравнить, кто оказался более строгим, а также ознакомиться со статистикой по данному виду преступлений.

Чрезвычайно интересной оказалась работа Александра Кукушкина, посвященная анализу статистики ДТП в России, в очень наглядной форме представившая интереснейшие и иногда крайне неожиданные результаты. Так, например, считается общеизвестным, что на Дальнем Востоке «много автомобилей с правым рулем», однако масштаб этого явления общественностью явно недооценен. Оказывается, автомобили с левым рулем практически не попадают в аварии уже начиная с Урала и далее на восток — т.е. на всей этой территории их доля исчезающе мала.



Все знают о транспортном кошмаре в предновогодние дни и о затишье во время январских каникул, но мало кто представляет, насколько это отражается на аварийности. Весьма распространенным является мнение, будто «женщины водят лучше мужчин», равно как и противоположное: «Дура, права купила, а ездить не купила!». Как ни странно, оба этих мнения подтверждаются статистикой: среди водителей-новичков аварийность у женщин втрое выше, чем у мужчин; через десять лет водительского стажа их показатели уравниваются, а дальше женщины показывают стабильно более качественный результат. Эта, без преувеличения, фундаментальная работа, в которой проанализировано еще много любопытных закономерностей, была удостоена второго места.

Первое место было присуждено проекту «От царя до РАМПа», посвященный неазвконному обороту наркотиков в России в течение последних ста лет. Помимо подробнейшего рассказа об истории вопроса авторы — команда Outlaw Crew — получили интереснейшие и действительно важные результаты. Так, обнаружилась несомненная связь между активностью правоохранительных органов и наркопреступностью — чем больше наркотиков было изъято в тот или иной период времени, тем ниже уровень как преступлений, связанных с оборотом наркотиков, так и преступлений, совершенных под их воздействием.

Но это еще цветочки. Авторы сумели собрать собственную статистику объявлений, размещенных в RAMP (Russian Anonimous Marketplace — теневом сегменте Рунета, где осуществляется незаконная торговля). Было определено количество предложений по тем или иным городам, города-чемпионы по тем или иным позициям, средняя по России стоимость того или иного наркотика, а также цена «наркотической продуктовой корзины» в крупнейших российских городах. По словам авторов, их ноу-хау позволяет автоматически анализировать размещаемые в RAMP объявления, что позволяет отслеживать динамику в реальном времени, контролировать эффективность проведенных мероприятий и, вполне возможно, вычленять первоочередные цели для оперативной работы. Этот инструмент наверняка будет взят Генпрокуратурой на вооружение.

В ряде проектов, представленных на конкурс и не получивших призов, содержались также весьма интересные и перспективные идеи, которые по тем или иным причинам не удалось реализовать на хакатоне. В частности, в одной из работ на основе анализа криминальной статистики прогнозируется вероятность совершения того или иного преступления в той или иной точке города. К сожалению, доступные сегодня исходные данные имеют недостаточно подробную географическую детализацию, чтобы реализовать эту затею, так что проект так и остался прототипом.

Другая интересная предложенная идея — наложить на карту доступные из открытых судебных источников сведения о местах проживания лиц, находящихся под административным надзором. Эти лица не имеют права покидать место проживания и периодически подвергаются проверкам; при этом они, по статистике, весьма часто совершают повторные преступления. Таким образом, анализ этих данных мог бы дать немало полезной информации о криминогенной обстановке, но, к сожалению, рамках конкурса дело ограничилось лишь концептом.

Все эти работы были сделаны на небольшом объеме исходных данных силами маленьких команд, некоторые из которых вообще состояли из одного человека, всего за два дня интенсивной работы. Когда Генеральная прокуратура в скором времени полностью раскроет криминальную статистику по всей России, органы власти, общественность и заинтересованные энтузиасты получат возможность сделать немало открытий.

Если вам понравилась статья - порекомендуйте ее своим друзьям, знакомым или коллегам, имеющим отношение к муниципальной или государственной службе. Нам кажется, что им это будет и полезно, и приятно.
При перепечатке материалов обязательна ссылка на первоисточник.