Как уже неоднократно отмечалось, движение Open Source уже давно вышло за пределы сугубо софтверной сферы, став в существенной мере важным источником и составной частью концепции открытых ИТ. Более того, есть основания говорит, что именно открытые ИТ, выйдя на рамки сугубо технической сферы, играют важную роль в формировании и реализации современной концепции открытого общества (открытое правительство, открытое государство и пр.). Примером этого развития идей открытости является динамично развивающееся во всем мире направления открытых данных (ОД), которому была посвящена часть докладов и дискуссий на апрельской конференции Russian Open Source Summit (ROSS) 2017.

Согласно определению Википедии, «открытые данные (англ. open data) — концепция, отражающая идею о том, что определённые данные должны быть свободно доступны для машиночитаемого использования и дальнейшей републикации без ограничений авторского права, патентов и других механизмов контроля». Хотя в этой формулировке не говорится о статусе владельцев ОД, но сегодня эта концепция ассоциируется в первую очередь с определенными обязательствами со стороны именно государства, в том смысле, что поддержка ОД является обязательным для правительственных структур, а коммерческие предприятия могут следовать ей на добровольной основе. То есть мы имеем дело с ситуацией, когда именно государство является своеобразным локомотивом продвижения идей ОД, подавая пример коммерческому рынку. Такая роль государства определяет тем, что именно оно аккумулирует огромные объемы разного рода данных, которые являются общественным достоянием.

Именно такое понимание роли государства было зафиксировано в Хартии открытых данных G8, которую Россия вместе с другими странами Большой восьмерки подписала в 2013 г. В этом документе, в частности, зафиксированы восемь базовых принципов ОД: полнота, первичность, своевременность, доступность, пригодность к машинной обработке, отсутствие дискриминации в доступе, отсутствие закрытых проприетарных форматов и лицензионная чистота.

Реализация положений Хартии подразумевает обязательства правительств по создания пространства открытых государственных данных (ОГД), которое должно стать не только средством расширения сферы применений ИТ и поддержки ИТ-бизнеса (в том числе на уровне стартапов), но и фактором общего развития социальной сферы и демократических моделей управления страной. С формальной точки зрения ОГД предназначены в первую очередь для разработчиков ИТ-систем, предпринимателей и разного рода исследователей, а уже через них — для более широкой общественности. Одна из ключевых идей концепции: разделение сфер деятельности органов власти и бизнес, когда первые берут на себя задачи предоставления ОГД, а вторыt — создания собственно разного рода информационных сервисов и продуктов, имея в виду, конечно, получение определенных коммерческих результатов. При этом государство экономит бюджетные средства на разработку собственных сервисов и обеспечивает высокий уровень качества предоставления услуг конечным пользователям за счет рыночной конкуренции.

Говоря о потенциале ОГД, руководитель департамента исследований и разработок консалтинговой группы «Полилог» Людмила Богатырева отметила, что реализация концепции позволяет решить целый ряд общественных задач, имея в виду разные категории заинтересованных сторон:

  • органы власти — привлекать граждан и бизнес к созданию новых продуктов, позволяющих экономить государственные средства;
  • общественные организации — осуществлять контроль за деятельностью органов власти;
  • бизнес — создавать новые и развивать существующие информационные продукты;
  • программисты — получать идеи для создания новых программ;
  • граждане — использовать созданные программы для повышения личного комфорта.

Публикация ОД в существенной мере отличается от уже достаточно освоенного органами власти информирования общества о своей деятельности. Во-первых, ОД по своей природе могут постоянно и порой весьма динамично изменяться, что подразумевает обеспечение их постоянно обновления и поддержки в актуальном состоянии. Во-вторых, такие источники данных должны обладать высоким уровнем доступности, учитывая то, что с ними могут работать разного рода приложения в реальном времени. В-третьих, если традиционное информирование обычно сводится к публикации копий уже существующих документов, то ОД зачастую формируются достаточно сложным образом в виде извлечения разнородной информации из различных информационных систем и объединения их в специальные наборы данных.

И, наконец, еще одна важная задача — определение состава публикуемых данных. Ведь объем данных, хранимых в государственных информационных системах очень велик, а процедура их публикации и последующего обслуживания — достаточно трудоемка. Соответственно, перед органами власти встает непростая задач отбора категорий данных для публикации, которая усложняется еще и тем, что никаких требований и даже рекомендаций «сверху» на этот счет нет. Понятно, что нужно публиковать ОД, которые пользуются реальным спросом, а это подразумевает не только проведение определенных предварительных исследований, но и создание какого-то механизма мониторинга уровня востребованности уже опубликованных данных.

Учитывая все эти моменты, Людмила Богатырева предложила такой алгоритм реализации процесса публикации ОД:

  1. определить заинтересованные стороны;
  2. выбрать источники данных;
  3. разработать модель данных;
  4. выбрать способ идентификации и связывания данных;
  5. выбрать и использовать стандартные справочники и классификаторы;
  6. преобразовать данные;
  7. обеспечить автоматическую публикацию и обновление данных;
  8. предоставить данные для людей и компьютеров;
  9. объявить о предоставлении новых наборов данных;
  10. уважать интересы общества — поддерживать и обновлять данные.

По ее мнению, хотя сегодня уже опубликованы достаточно большие объемы разнообразных ОГД, их реальная востребованность со стороны разработчиков приложений еще не очень велика вследствие отсутствия доверия к поставщику данных и к достоверности опубликованных данных. Причиной этой ситуации являются низкое качество (неполнота, недостоверность, дублирование) данных в их изначальных источниках (реестрах, регистрах, перечнях и т. д.), отсутствие механизмов постоянной актуализации публикуемых данных (мало автоматически публикуемых наборов), а также отсутствие справочников и классификаторов, что не позволяется интегрировать данные разных наборов.

Вместе с тем Людмила Богатырева привела ряд успешных примеров создания прикладных решений и сервисов на базе ОД в сфере туристического бизнеса. Речь, в частности, идет о публикации (в режиме ежедневного обновления) на портале Ростуризма данных Единого федерального реестра туроператоров (ЕФРТ). Эти наборы данных пользуются достаточно большой востребованностью (более 350 тыс. скачиваний за последние полгода) сразу в нескольких приложениях, которые в том числе позволяют пользователям получить информацию о туроператорах и оценки рейтинга их надежности перед заключением контрактов. В некоторых сервисах используются данные не только ЕФРТ, но также Банка России, Высшего арбитражного суда, ФНС, ФССП и ФАС.

По мнению докладчика, дальнейшее развитие наборов данных ЕФРТ может идти в направлении публикации еще ряда потенциально связанных наборов данных: перечень страховых организаций и банков, предоставляющих финансовое обеспечение туроператорам (данные Ростуризма), финансовые показатели деятельности страховых организаций, осуществляющих страхование ответственности туроператоров (данные Банка России) и сведения реестра турагентств (данные Турпомощи).

В повышении эффективности реализации концепции ОД важную роль играет наличие механизмов мониторинга и контроля со стороны как государственных, так и общественных структур. Сделав акцент на этот аспект темы, директор по аналитике проектного центра «Инфометр» Вячеслав Романов поделился сведениями о результатах проведенных его компанией с 2014 г. аудитов.

Они позволяют уверенно говорить, что объемы и качество публикуемых ОД растут, но вопрос о том, насколько динамика этого процесса удовлетворяет потребности общества, является открытым. Так, число регионов, которые вообще не публикуют ОД, снизилось с 2014 по 2016 гг. с 20 до пяти, но почему «закрытые» регионы еще есть, не очень понятно. Хотя на всех уровнях власти (федеральный, региональный и муниципальный) есть свои лидеры в этой сфере, в целом виден целый ряд проблем, среди которых Вячеслав Романов выделил такие аспекты, как непонимание сути концепции ОД, нехватка средств, децентрализация работ, недостаточная оценка востребованности, отсутствие указаний на источники. Следствием этого являются недостаточный объем публикуемых данных и их низкое качество, неэффективное использование средств, торможение развития социального информационного пространства.

По мнению докладчика, для решения проблем в сфере ОД нужны объединенные усилия государства и бизнеса по следующим направлениям:

  • создание инструментов для формирования «ручных» наборов данных;
  • аудит и доработка существующих информационных систем;
  • оценка востребованности, работа с потребителями;
  • унификация типовых наборов данных (межрегиональное сотрудничество);
  • организация мероприятий по популяризации ОД.

В целом же на основе анализа ситуации Вячеслав Романов сделал уверенный вывод, что большинство проектов на основе ОД создаются в условиях сотрудничества потребителей с органами власти.