Вот суровая правда: каталоги данных не вызывают у большинства людей восторга. На самом деле, это похоже на поход к стоматологу: почти никому не нравится это делать, но альтернатива еще хуже. Другими словами, хотя большинство людей признают важность каталога данных, к нему часто относятся как к необходимому злу, пишет на портале Datanami Джон Манкберг, старший вице-президент по миграционным продуктам поставщика решений для управления данными Syniti.

Каталогизация данных, конечно, не самый приятный процесс, но очень важный. Более того, его потенциал гораздо выше, чем те возможности, которые большинство организаций используют в настоящее время. Каталог данных играет важную роль в реализации долгосрочных инициатив по обеспечению качества данных — и им можно распорядиться так, чтобы получить наибольшую отдачу.

Эти чертовы каталоги данных

Все хотят иметь каталог данных, но никто не хочет выполнять эту работу. Представьте себе, что ваш начальник говорит вам, что теперь вы должны будете документировать все, что вы делаете, все то, что живет в вашей голове. Вы сразу поймете, что это достойная восхищения цель, которая в то же время потребует кучи работы. Это тяжелая и утомительная работа по вводу данных.

И что еще хуже, каталог данных будет полезен только тогда, когда в нем накопится критическая масса данных. Его нельзя просто включить в один день и ожидать, что в нем будет все, что кто-либо захочет найти.

Однако когда вы приступаете к проекту миграции данных, то обнаруживаете, что ключевой частью этого проекта является создание всех активов, которые в конечном итоге станут каталогом данных. Возможно, организация соберет группу специалистов для документирования того, как будет выглядеть новая система с точки зрения бизнес-правил, интерфейса и т. д. Вся эта документация обычно создается с помощью такого инструмента, как MS Word, а затем помещается в такую систему, как SharePoint, но зачастую нет никакой мотивации возвращаться и обновлять ее после завершения работы. Документы, которые были актуальны полгода назад, уже не актуальны, и процесс их обновления может показаться пугающим.

Сбор данных, стимулирующий миграцию

Итак, мы установили, что, хотя каталоги данных в конечном итоге могут дать много интересных инсайтов, цена каталогизации высока. И вы не обязательно будете скучать по каталогу, пока у вас не возникнет требующий ответа вопрос. Но что, если бы существовал другой способ реализации этого процесса, более осмысленный и в конечном итоге плодотворный?

Вместо того чтобы собирать всю эту информацию в отдельных, не связанных друг с другом инструментах (таких как Excel, SharePoint и Word), что если бы вы могли поместить ее в инструмент, интегрированный в систему? Это означало бы, что в процессе сбора данных можно было бы управлять и процессом их миграции.

Другими словами, если вам все равно придется собирать и фиксировать всю эту информацию, то лучше сделать это таким образом, чтобы ее можно было использовать многократно. Более стратегический подход к сбору данных дает много потенциальных преимуществ, поскольку в конечном итоге его можно будет использовать для гораздо большего в будущем. Задача состоит в том, чтобы сделать это частью процесса миграции.

Будущее каталогов данных

Если сделать каталоги данных ключевой частью процесса миграции, то у организаций появится больше причин обновлять каталог, если в нем что-то изменится. Появится дополнительная мотивация, поскольку именно это будет стимулировать миграцию. Легче поддерживать каталог данных, если он является движущей силой бизнес-процесса.

Получив каталог данных, вы также сможете стимулировать изменения. Вы зафиксировали все правила, и они становятся частью вашего решения по обеспечению качества данных. Вам не нужно заново начинать проект по качеству данных, достаточно просто изменить свои бизнес-правила.

Вы сможете начать использовать каталог для управления данными. Невозможно построить автоматизированный процесс управления, если вы не создали каталог данных. Хорошая метафора — Google Maps: чтобы начать работу, команда Google должна была составить карту мира, а затем наложить на нее указания по проезду, но прежде чем получить значимый результат, необходимо было сделать первый фундаментальный шаг — составить карту. Каталоги данных — это тот самый фундаментальный шаг, когда речь идет о более крупных и значимых проектах по работе с данными.

Изменения и KPI становятся проще

Вот сценарий для рассмотрения. Представьте себе, что вам звонят и спрашивают, как повлияет на всю систему изменение нумерации материала. Без каталога данных попытка выяснить это может превратиться в сложный процесс. Но с каталогом данных у вас есть система, которая определяет нумерацию и ее взаимосвязь со всеми остальными элементами, что позволяет легко провести необходимый анализ.

Как только все эти метаданные окажутся в системе, можно приступать к созданию отчетов по ключевым показателям эффективности (KPI) и использовать эти KPI поверх метаданных. Даже если вы смените систему, вам не придется запрашивать запросы, лежащие в основе отчета по KPI, который вы рассылаете каждый месяц.

Все эти вещи в конечном итоге становятся проще. То, что часто считалось необходимым злом, открывает целый мир новых возможностей.

Другие функции, которые становятся гораздо проще после создания каталога данных, включают:

— автоматизация задач: сюда можно отнести автоматизацию создания отчетов об ошибках для проверки недостоверных или отсутствующих данных, автоматическое создание управленческих отчетов и многое другое;

— доступ к просмотру: теперь, когда у вас есть данные, каждый может получить к ним доступ;

— измерение и оценка качества данных.

И это только верхушка айсберга.

Каталоги данных как катализаторы

Несмотря на то что каталоги данных часто воспринимаются как скучная и тяжелая работа, не стоит недооценивать их важность и потенциал. Каталогизация данных является важнейшим компонентом долгосрочных инициатив по обеспечению качества данных. Вместо того чтобы рассматривать каталоги данных как отдельные инструменты, организации могут интегрировать их в свои системы, что позволит постоянно их обновлять и использовать полученную информацию для получения будущих выгод.

Если сделать каталоги данных неотъемлемой частью процесса миграции, у организаций появится больше стимулов для их поддержки и обновления. Имея полный каталог данных, организации могут легко анализировать влияние изменений, создавать отчеты по KPI и исследовать новые возможности. То, что раньше считалось необходимым злом, в действительности может стать катализатором более эффективного и преобразующего будущего, основанного на данных.