Бурный рост массовых услуг в таких сферах, как банковская, страховая и телекоммуникационная, выводит на первый план проблему достоверности и полноты данных о клиентах. Нередко подобная информация рассредоточена в разнородных бизнес-приложениях, эксплуатируемых в компании, и во внешних по отношению к ней источниках. Чтобы учесть ее в полной мере, необходимо консолидировать данные из всех систем в одном месте, но при этом в полный рост встает проблема качества получаемой информации. Записи о клиентах в каждой системе могут находиться в своем формате, иметь альтернативные способы представления, да и попросту содержать опечатки или ошибки. Решать такие задачи призваны средства интеграции данных о клиентах (Customer Data Integration, CDI) и повышения их качества (Data Quality, DQ), которые предлагаются многими зарубежными вендорами. Однако в них практически не учитываются ни особенности русского языка, ни отечественные стандарты и справочники. Об этом заявил генеральный директор фирмы HumanFactorLabs Дмитрий Журавлев на презентации решения для управления клиентскими данными, созданного его фирмой совместно с компанией РДТЕХ.

В качестве инструмента для интеграции данных в этом решении используется продукт Oracle Siebel Universal Customer Master (UCM), а для их очистки и приведения к стандартному виду – система “Фактор”, разработанная специалистами HumanFactorLabs. По своим функциональным возможностям Siebel UCM близок к представленному корпорацией Oracle несколько лет назад продукту Customer Data Hub. И в том, и в другом строится центральная БД с полной информацией о клиентах, консолидированной из разнородных источников и приведенной к требуемому уровню качества. В зависимости от установленной в компании политики записи о клиентах в источниках могут либо синхронизироваться с эталоном, лежащим в центральной БД, либо оставаться неизменными, но в любом случае в корпоративной ИС появляется единый “источник правды” и каждый из клиентов обретает свой уникальный идентификатор. Как пояснил руководитель направления CRM компании РДТЕХ Андрей Юрин, после покупки корпорацией Oracle компании Siebel в качестве базового универсального средства по интеграции клиентских данных вендором предлагается решение Siebel UCM, а Oracle CDH стал одним из модулей ERP-системы Oracle E-Business Suite.

Указанная централизованная архитектура позволяет заметно повысить качество выпускаемой отчетности и маркетинговых кампаний, точнее управлять рисками, снизить накладные расходы при взаимодействии с такими внешними системами, как Бюро кредитных историй или Агентство по страхованию вкладов. Впрочем, все ее достоинства проявятся лишь при достаточно высоком качестве консолидированной в центральной БД информации. А достичь его, особенно когда клиентов много, а записи о них формируются вечно перегруженными операторами call-центров, очень непросто. Нередко один клиент оказывается отражен в БД несколько раз из-за нелепой опечатки (Ивонов вместо Иванов) или небрежности (Саша вместо Александр). Сведения о нем бывают неточны или неоднозначны (скажем, в адресе указана Коломенская, д. 3, но непонятно, идет ли речь об улице или набережной). Практика показывает, что по мере приближения к недостижимому идеалу — 100-процентному уровню качества — затраты на каждый очередной процент экспоненциально возрастают. Решить эту задачу без промышленных средств управления качеством данных, просто нереально.

Если клиентов не очень много, то очистить данные можно вручную или при помощи ПО, разработанного силами собственных программистов. Хотя в общем случае, считает Дмитрий Журавлев, такое решение приносит, как правило, больше вреда, чем пользы. Каждый человек, внося исправления в запись, руководствуется своими одному ему известными соображениями. В результате может оказаться, что хотя после ручного исправления вызывавшие сомнения записи в БД и становятся логически непротиворечивыми, они не имеют никакого отношения к действительности. И обнаружить впоследствии ошибки подобного рода будет чрезвычайно сложно. Есть еще одно обстоятельство, которое делает кустарные подходы малоэффективными. Выявление всевозможных огрехов с помощью бизнес-правил и изощренных алгоритмов, сопряженное с огромными трудозатратами, должно обязательно дополняться верификацией сомнительных данных по обширным и тщательно выверенным справочникам (имен, адресов, почтовых и телефонных кодов, названий компаний и организаций). И алгоритмы, и справочники должны учитывать специфику нашей страны и русского языка. К примеру, широко применяемые в западных продуктах методы выявления опечаток, основанные на поиске похожих слов в справочниках и словарях (по написанию или по звучанию), совершенно неприменимы к русскому языку. Кроме того, у нас в стране, в отличие от большинства других, можно уточнить адрес клиента, сопоставив его с региональным телефонным кодом.

По словам Дмитрия Журавлева, в предлагаемом его компанией продукте “Фактор” все эти и множество других национальных особенностей очистки данных приняты во внимание. В частности, в нем поддерживается отечественный Классификатор адресов России (КЛАДР), верифицируются коды ИНН и КПП, проверяется корректность паспортных данных и подлинность электронных адресов (не только на существование указанных там доменов, но и на наличие физического соединения с почтовым сервером). Разумеется, и при такой тщательной проверке отдельные элементы данных иногда не удается идентифицировать однозначно. Очень важно то, что в подобных ситуациях факт неполной достоверности фиксируется путем присвоения специального кода каждой сомнительной записи о клиенте. Такие “коды качества” позволяют в любой момент уточнить, какие проблемы не имели однозначного решения, какие элементы данных сомнительны и насколько они пригодны для использования в тех или иных операциях (например, для рассылки по обычной почте).

Согласно собственным оценкам HumanFactorLabs, российский рынок систем CDI и DQ растет в последнее время с темпом около 300% в год. Его сегмент, отвечающий за качество данных, контролируется отечественными компаниями, предлагающими продукты “западного качества”. Пока что наибольший спрос на подобные инструменты наблюдается со стороны филиалов крупных транснациональных компаний. Некоторые из них (Microsoft, Samsung, Johnson & Johnson, Peugeot, Nissan) уже используют продукт “Фактор”. Появились и первые российские заказчики: “Ренессанс страхование”, КМБ-Банк, СОГАЗ, АМИ-Банк.

Давая свои рекомендации компаниям, которым предстоит выбирать решение такого рода, Дмитрий Журавлев посоветовал обращать внимание на наличие у поставщика успешных внедрений в нашей стране, объемы используемых справочников, возможности тонкой настройки, масштабируемость продукта и ряд других факторов. Очень важно также протестировать систему на собственных контрольных примерах, а не на тех, что предлагают поставщики решений.