Во многом цифровая трансформация — это неизведанная территория: подавляющее большинство компаний понимают, что растущий набор технологий не оставляет им иного выбора, кроме как двигаться этим путем, но многие вендоры пока что не до конца представляют, как организовать подготовительные процедуры для перехода. Исполнительный вице-президент по маркетингу разработчика NoSQL-баз данных MarkLogic Джо Паскуа на портале TechRepublic обсуждает проблематику обустройства единой базы данных — одного из ключевых элементов инфраструктуры компании, вставшей на рельсы цифровизации.

По его словам, успех цифровой трансформации напрямую связан с тем, как на предприятии обустроена работа с БД. В идеале это должна быть единая среда с беспроблемным доступом, но не всем фирмам удается его наладить. Основная сложность тут возникает с разнообразием разрозненных данных, поступающих из социальных сетей, смартфонов, IoT-гаджетов, не говоря уже о том, что БД крупных предприятий могут храниться сразу в нескольких облачных хранилищах, быть связанными со множеством систем CRM, ERP или EMM.

На этом фоне четко вырисовывается необходимость в модели БД, которая была бы больше нацелена на масштабируемость. Необходимо более простое решение, чем существующие реляционные БД, при этом не уступающее им в ряде конкретных задач. В первую очередь, это задачи построения облачных хранилищ, где конечному пользователю в первую очередь важна скорость доступа и возможный объем хранимой информации.

«Распределенные базы данных как нельзя лучше соответствуют концепции цифровой трансформации, потому что когда к ней приступают крупные компании, они сталкиваются с большими проблемами, одна из которых — их данные, которые находятся повсюду. А ведь информация о клиентах и поставщиках — это самый ценный актив предприятий, но он разбросан между 20, 30 и даже 40- системами», — отметил Паскуа.

По его мнению, очень сложно принимать правильные решения или внедрять новые операционные подходы, когда твои источники обитают в стольких местах. «Компании начинают пробуксовывать. В теории они приступают к цифровой трансформации, но на практике им приходится охватить 30 старых систем с разными форматами данных и жесткой привязкой к ним. В итоге все оборачивается тем, что проект по упорядочиванию собственных БД, который должен быть завершен по истечении трех месяцев, занимает полтора года, при том, что большую часть этого времени предприятия выясняют, как им добраться до своих данных или как их сгруппировать», — пояснил Паскуа.

Он предлагает крупным компаниям, разбираясь с унаследованными системами, обратиться к опыту небольших молодых компаний, взяв за основу их проворность. «Большие предприятия хотят быть такими же быстрыми и гибкими, но при этом не желают расставаться с накопленными данными. Собственно, в этом и заключается их миссия — быть самими собой, но теперь им нужно стать быстрее», — считает Паскуа.

Допустим, фирмы хорошо осознают ценность своей информации и хотели бы обеспечить бесшовный доступ к ней, разместив в единой БД, но как это сделать? Паскуа обращает внимание, что на этом пути многие компании делают непоправимую ошибку: в попытках упорядочить свои базы данных обращаются к традиционным технологиям для агрегации, упорядочивания и очистке данных от ненужных метаданных. «Это продиктовано тем, что в тех 5 или 20 системах, которые вы применяете, организация баз данных, сбор и распределение байтов устроены по-разному. В итоге вы решаете применить для данных супермодель, которая могла бы наконец собрать их из всех источников и объединить в единое целое», — сказал он. Однако такой подход выливается в громадный объем работы с непредсказуемым результатом: «Стремление к инновациям оборачивается рутиной. Компании вхолостую тратят свой ресурс и вместо цифровой трансформации приходят к хаосу».

По мнению Паскуа, лучше занять другую позицию: «Движение не должно быть хаотичным — лучше нацелиться на кратковременный, но поступательный результат. Возможно, вас подгоняют требования европейского регламента GDPR для сведения данных, но и в этом случае вам не нужна супермодель: аккумулируйте данные таким образом, чтобы не сворачивать рабочие системы».

Эксперт советует не поддаваться соблазну собрать данные «для всего, что только может понадобиться». Это опрометчивое решение, для реализации которого могут понадобиться годы. «Формируя единую БД, разработайте методику, которая позволяет объединить данные, полученные из унаследованных систем. Не забывайте о форматах данных — у некоторых систем они не будут совпадать. Затем приступайте к переносу и заодно обдумывайте свой следующий шаг», — добавляет Паскуа. Таким образом будет накапливаться новая база, создаваться новый центр данных, то есть изолированный слой информации, позволяющий не прибегать к устаревшим БД десятков унаследованных систем.

Эксперт выделяет несколько критериев, которые помогают понять, насколько БД готова (или не готова) к цифровой трансформации. Первый — это скорость получения данных из внешних источников. Если их извлечение, трансформация и очистка (чтобы они соответствовали потребностям бизнес-модели), а также загрузка в хранилище требует предварительной обработки, значит качество БД оставляет желать лучшего. «База данных должна упрощать получение данных независимо от их вида, формата или стиля», — поясняет Паскуа.

Второе, на что нужно обратить внимание — это управление. Аккумулируя множество ценной корпоративной информации в одной точке, компания обычно думает о ее защите, но с этим важно не переусердствовать. Паскуа говорит, что не менее важная наука — это управление данными, поскольку есть немало компаний, которые владеют озерами данных о клиентах, но не понимают ни природы их происхождения, ни того, что с ними делать. По его словам, компания, заботящаяся о конфиденциальности данных клиентов, должна следить не только за наполнением БД, но и за качеством информации. «Качественная база сохраняет метаданные — детальную информацию обо всех объектах системы. Примерами таких объектов могут служить таблицы, представления, ограничения целостности, триггеры, правила безопасности и т. д. В результате пользователь может обращаться к метаданным так же, как и к прикладным данным. Важно удобство управления метаданными — какой бит, когда и откуда он появился, что я могу с ним сделать», — разъясняет Паскуа.

Следующий критерий — адаптивность БД: она должна приспосабливаться к требованиям конкретной компании. В сегодняшних реалиях БД во многом зависят от специфики деятельности компании: если это банк, то, как правило, базы обрабатываются мощностями своего ЦОДа, но все же подавляющее большинство организаций нацелено на облако. Конечно же, туда переносится только часть нагрузок, но в скором времени все больше компаний будут переносить в облака целые инфраструктуры. Облачные провайдеры создают все необходимые для этого условия, и у предприятий есть достаточный выбор, на кого положиться.

Замаячила и новая перспектива — специализированные облачные провайдеры, которые будут подстраиваться под требования СМБ, а также новое поколение мультиоблачных ЦОДов, которые могут оперировать сразу несколькими окружениями и при этом соблюдают GDPR.

Паскуа рекомендует не внимать громким заявлениям об успешных внедрениях цифровых проектов, говоря, что ориентироваться нужно на себя и не сбрасывать со счетов имеющиеся накопления информации, посчитав их устаревшими. В качестве примера он приводит мейнфреймы, которые работали 30 лет назад и проработают еще столько же. Очевидно, что их время уже прошло, но они существуют, потому что хорошо интегрируются с существующими технологиями, подводя основание для новых. Экперт считает, что системы, которые перекидывают мост между прошлым и будущим, — это идеальный вариант для компаний, которые обладают большим парком унаследованного софта и не могут расстаться с ним в один миг.