Уильям Макнайт, президент McKnight Consulting Group, приводит на портале InformationWeek несколько ключевых шагов, которые вы можете предпринять для получения ощутимой отдачи от инвестиций в ваши инициативы по обеспечению качества данных.

В то время как вы продвигаете вперед бесчисленные проекты, которые опираются на данные в вашей организации, уделите внимание качеству этих данных. Независимо от того, собираются ли данные в аналитической базе данных для выявления мошенничества или в озере данных для четырех-пяти различных проектов, эти данные должны соответствовать стандарту качества, который делает их пригодными для использования по назначению.

Качество данных — это трудноопределяемая тема, которая не поддается измерению и в то же время является достаточно важной, чтобы сорвать любой проект. Не стоит иметь слишком оптимистичные предположения относительно эффективности данных. Качество данных — это философия бизнеса, которая позволяет согласовать стратегию, бизнес-культуру, корпоративную информацию и технологии, чтобы управлять данными с пользой для предприятия. Проще говоря, это компонент конкурентной стратегии.

Несмотря на это, многие просят дать количественную оценку включению в проекты работ и ПО для обеспечения качества данных.

Хотя повышение качества данных дает множество преимуществ, многие из них не поддаются измерению. Такие преимущества, как повышение скорости принятия решений, единая версия правды, повышение удовлетворенности клиентов, улучшение морального состояния, улучшение имиджа компании и согласованность между системами, аккумулируются, но организация должна избирательно выбирать, какие преимущества следует подвергнуть дальнейшему анализу и перевести в денежное измерение, поскольку ROI должен измеряться в деньгах.

Измерение возврата инвестиций в качество данных требует программного подхода. Улучшение качества данных — это не просто еще одна технология, которую необходимо внедрить. Для получения полной отдачи необходимы инвестиции в технологии, а также в организационные изменения. Качество данных находится в фокусе современных бизнес-целей, которые признают, что каким бы бизнесом ни занималась компания, она также занимается данными. Вперед выйдут те компании, у которых данных больше, они чище и доступнее и есть инструменты для их использования.

Ощутимая окупаемость инвестиций в качество данных

Абстрагирование качества в виде набора согласованных правил работы с данными и измерение случаев нарушения качества обеспечивают возврат инвестиций в качество данных. Основные шаги, которые вы можете предпринять и реализовать, чтобы получить ощутимую прибыль от инвестиций в качество данных, начинаются с определения правил обеспечения качества данных.

Качество данных можно определить как отсутствие недопустимых дефектов. Существует конечный набор показателей, которые могут определять дефекты качества данных и которые классифицируют все правила качества данных, такие как существование данных, ссылочная целостность, ожидаемая уникальность, ожидаемая кардинальность, точные вычисления, данные в ожидаемых границах и просто корректные данные.

Правила, созданные на этом этапе, — это правила, которым должны соответствовать ваши данные. Эти правила должны применяться везде, где находятся важные данные.

Следующий шаг — определение качества данных с помощью профилирования данных и определения приоритетов. Обычно никто не может сформулировать, насколько чисты или грязны корпоративные данные. Но без такого измерения чистоты невозможно оценить эффективность мероприятий, направленных на повышение качества данных.

Измерение качества данных начинается с инвентаризации. Оценка важных данных по нескольким осязаемым показателям, которые могут быть использованы для измерения качества данных, позволит вам начать переводить смутные ощущения чистоты в нечто осязаемое. При этом можно сосредоточиться на тех действиях, которые могут улучшить важные элементы качества. В конечном счете, улучшение качества данных осуществляется на небольшом подмножестве элементов данных, поскольку большинство элементов уже соответствуют стандарту. Однако это подмножество должно быть тщательно отобрано. По-другому можно сказать, что инициативы по улучшению качества данных не являются всеобъемлющими для всех элементов корпоративных данных и всех возможностей.

Затем следует провести профилирование данных с помощью ПО или запросов к данным, показывающих разброс данных в затронутых столбцах и проверяющих соблюдение правил. После определения правил и профилирования данных необходимо провести оценку качества данных. Балльная оценка представляет собой состояние качества данных для данного правила. Системная оценка — это совокупность оценок правил для данной системы, а общая оценка — это пропорциональная совокупность системных оценок.

Оценка качества данных

Окупаемость инвестиций — это аккумулирование всех доходов и инвестиций от создания проекта, его обслуживания и сопутствующих бизнес- и технологических мероприятий до конечных желаемых результатов — при этом учитываются возможные результаты и их вероятности. Каждый проект индивидуален, но при прочих равных условиях оценки качества данных в системе приводят к разным результатам работы системы, а значит, и к разной рентабельности инвестиций.

Окупаемость инвестиций достигается не путем интеллектуального определения того, как должны выглядеть данные, а с учетом затрат на функционирование системы, если данные будут недостаточно качественными.

Таким образом, чтобы повысить ожидаемую рентабельность проекта, нам следует улучшить качество данных. Но какой ценой? На последнем этапе вы детализируете действия по улучшению качества данных и рассчитываете стоимость достижения идеального уровня качества данных. Вы можете задерживать данные, в которых есть нарушения, исправлять их, сообщать о них, исправлять источники и т. д.

Готовность тратить средства на улучшение качества данных должна полностью определяться на основе способности повысить показатели качества данных, которые соотнесены с доходностью проекта.

Нет сомнений в том, что придать ценность данным, которые собираются в системах организаций, довольно сложно. При этом организации требуют ощутимой отдачи от инвестиций, и качество данных не является исключением.

Мы находимся в захватывающем историческом периоде. Организации начинают осознавать, что данные, которые они собирают и которыми управляют, следует рассматривать как корпоративный актив. В конечном счете, качество данных может стать преимуществом или недостатком в их проектах.