Проблема

Чиновников очень часто упрекают в оторванности от реальности. Взять хотя бы старый случай, когда полпред президента говорил про iPad или iPhone, который, вероятно, есть у каждого студента. И ведь нельзя сказать, что он не прав. Наверняка в том окружении, в котором ежедневно существует чиновник такого ранга, у каждого первого молодого человека в руках именно гаджет с надкушенным яблоком на борту (опять же, они гораздо более узнаваемы, чем разнообразный парк моделей под Android). Просто не был вовремя готов достоверный статистический срез по конкретно этой группе населения.

Или другой пример: субсидии для регионов. Когда по всем показателям, следующим из исследования (к слову, заказанного этим же регионом) получается что муниципалитет гол как сокол, и ему срочно, очень срочно, требуются деньги. И вроде как есть сомнения по поводу того, насколько цифры совпадают с реальной картиной мира. Вот только где же взять достоверное статистическое исследование, подтверждающее или опровергающее предложенные выкладки.

Решение

16 ноября 2016 года произошло знаменательное событие — Сбербанк на основе технологии Big Data открыл доступ к обезличенным данным о финансовой активности своих клиентов и выложил их в свободном доступе для всех желающих. «Мы делаем это для того, чтобы показать свою заинтересованность и технологическую продвинутость, а еще помочь людям, которые занимаются статистикой, макроэкономикой, найти еще один довольно полный источник данных», — сказал руководитель проектов центра прикладных данных Сбербанка Владимир Бакланов.



Проект получил название «Открытые данные», за что тут же подвергся критике, потому что полностью критериям открытости эти данные не соответствуют. Однако, если отбросить саму формулировку, то перед нами открывается доступ к интереснейшим статистическим выкладкам, которых до этого на рынке просто не существовало.

В чем преимущество: как правило, большинство статистических оценок, в изобилии присутствующих на рынке, рассчитывается на тех или иных ограниченных выборках данных. Другими словами, достоверность выводов очень сильно зависит от того, насколько массовую и насколько репрезентативную выборку взяли исследователи. В случае со Сбербанком собирается статистика по всем доступным им клиентам. Учитывая, что банк занимает долю от 40% до 90% на различных финансовых рынкам, анализирует данные по 135 млн частных и более 1,5 млн корпоративных клиентов, то выборка получается весьма обширной, а картина экономических процессов, происходящих в стране – весьма и весьма достоверной.

Увы, в тех данных, что представлены в открытом доступе, показана весьма обобщенная информация. Однако и она любопытна и позволяет делать простые сравнения. К примеру, можно посмотреть в динамике среднюю заявку на ипотеку, скажем, в Башкирии и Татарии.



Или взглянуть на реальное соотношение зарплат в среднем по России, Москве и Санкт-Петербурге. 


Или посмотреть, сколько в среднем человек тратит на себя, опять же с разбивкой по регионам или посмотреть еще с десяток показателей. В ближайшее время Сбербанк планируется добавить данные по тратам населения на различные группы товаров и услуг. Вообще, список показателей и данных для публикации банк планирует постоянно расширять.

Зачем это нужно Сбербанку? Руководство Сбера планирует извлечь из проекта «Открытые данные» неплохую выгоду — прогнозы и статистические модели предполагается продавать. Поэтому представленная информация — это некий аналог демонстрационной версии, позволяющей понять, какие данные можно получить. Также банк намерен прогнозировать поведение потребителей или клиентов того или иного региона использовать эти прогнозы в своих целях. По словам вице-президента Хлызова «работа с «Открытыми данными» может сэкономить Сбербанку десятки миллиардов рублей». Ну а сколько денег эти данные сэкономят государству – покажет время.

Если вам понравилась статья - порекомендуйте ее своим друзьям, знакомым или коллегам, имеющим отношение к муниципальной или государственной службе. Нам кажется, что им это будет и полезно, и приятно.
При перепечатке материалов обязательна ссылка на первоисточник.