Джефф Моуд

Киоски данных  -  это нечто вроде закусочных, где   быстро подается деловая информация. Но постоянное посещение как тех, так и других может в конце концов привести к несварению

Служащие CKE Restaurants (Анахейм, шт. Калифорния) любят свои киоски данных почти так же горячо, как посетители ресторанов этой фирмы любят гамбургеры, мексиканские лепешки и другие блюда, которые можно перехватить на скорую руку. За последние два года компания Carl’s Jr. Restaurants быстро росла, делала приобретения и в результате утроила свой доход, доведя его до 537 млн. долл. Одновременно с этим рос аппетит и у жаждущих информации пользователей. Чтобы удовлетворить его, служба информационных технологий CKE затратила около 300 тыс. долл. и разработала 22 новых многомерных киоска данных для онлайновой аналитической обработки данных.

Пол Уортенберг из СКЕ Restaurants

Но это  -  не предел. Группа информационных услуг фирмы CKE способна сейчас “испечь” новый киоск данных очень быстро  -  на это ей требуется всего 30 дней. Пол Уортенберг, менеджер информационного и технологического планирования CKE Restaurants, рассказал: “Бывает так, что я уезжаю на несколько дней, а когда возвращаюсь, в планах стоит еще пять кубов онлайновой оперативной обработки”.

Однако менеджеры информационных отделов и пользователи CKE уже поняли то, что хорошо известно большинству клиентов их ресторанов: постоянное потребление полуфабрикатов (как пищевых, так и информационных) может оказаться кратчайшим путем к серьезному несварению. В нашем случае пользователи CKE, обращаясь в различные киоски данных, зачастую получали противоречивые ответы. А подавать информацию из ОС на постоянно растущий шведский стол киосков данных становилось все сложнее. Ведь только на полное обновление всех киосков онлайновой оперативной обработки данных CKE уходит до 30 ч.

По словам Уортенберга, “разработать и внедрить один куб онлайновой обработки данных нетрудно, но сейчас мы достигли точки, в которой управление ими стало тяжким бременем. И возникает вопрос: не пора ли остановиться?”.

С такой же проблемой сталкиваются и многие другие менеджеры информационных услуг. Создавая систему поддержки принятия решений, большинство компаний львиную долю средств затрачивает не на централизованное хранение информации, а на киоски данных (см. график “Планируемая архитектура...”). Причина очевидна: киоски данных гораздо дешевле, чем большое хранилище масштаба предприятия, и ввести их в эксплуатацию можно намного быстрее.

К сожалению, за бессистемное создание автономных киосков данных приходится расплачиваться. Принимаясь за них, прежде всего нужно развернуть  базовую  архитектуру поддержки принятия решений в масштабе всего предприятия или выработать четкие формулы распространения данных. Только так можно упростить управление киосками и сделать их более полезными для бизнеса. Эксперты в области хранения данных отмечают: эксплуатация автономных киосков данных (их часто называют lega-marts, т. е. унаследованные киоски), как и других унаследованных приложений, обходится весьма дорого и в конечном счете их приходится перестраивать или заменять.

Ральф Кимбол, пионер централизованного хранения данных и консультант в этой области,работающий в Боулдер-Крик (шт. Калифорния), рассказал: “Я видел слишком много компаний, где все кому не лень принимались за разработку киосков данных, которые в результате оказывались несовместимы между собой. Но в какой-то момент сами создатели, критически взглянув на собственные киоски данных, говорят: "Замысел был неплох, но не мешало бы тщательнее продумать его и правильнее воплотить". После этого они отказываются от плода своих рук и начинают полную перестройку”.

Одним киоском вы не ограничитесь

Но как же в подобных ситуациях оказываются менеджеры ИС? Многие организации обращаются к киоскам данных после того, как у них возникли трудности при создании больших вертикальных хранилищ данных масштаба предприятия.

Нынешняя архитектура хранилищ данных

Фирма GTE Supply (Ирвинг, шт. Техас), например, переключилась на киоски данных после того, как ее руководство устало ждать результатов проекта Synergy, в рамках которого планировалась разработка хранилища данных под таким же кодовым именем. Роджер Коупленд, штатный администратор по новым технологиям этой фирмы, вспоминает: “Мы затратили слишком много времени на организацию комплексной модели данных для своего хранилища. Наш проект обрушился под тяжестью собственного веса”. Сейчас GTE Supply сосредоточила свое внимание на киосках данных, но при этом старается делать все в рамках общей архитектуры.

Менеджеров ИС подталкивает к созданию унаследованных киосков и реклама таких продуктов. Билл Инмон, еще один ветеран централизованного хранения данных из Энглвуда (шт. Колорадо), считает: “Производители инструментов для киосков данных всячески расхваливают свою продукцию. Они утверждают, что киоски работают быстро, стоят дешево и просты в использовании. Что  вы можете разрабатывать такие структуры, нисколько не заботясь об общей архитектуре. Конечно, если разворачивать один-два киоска, это так; в целом же они вводят всех в заблуждение. Ведь чаще всего число киосков оказывается намного больше”.

По мере распространения разрозненных киосков данных может возникнуть ряд проблем. Так, эксперты считают, что на большом предприятии сопровождение и управление работой киосков может обойтись гораздо дороже, чем эксплуатация центрального хранилища данных. Дело в том, что каждый автономный киоск данных использует собственные программы и графики извлечения данных из производственных источников, их транспортировки и преобразования в многомерный куб (или другую структуру поддержки принятия решений). В классической среде унаследованных киосков управлять всеми этими программами и графиками приходится индивидуально, даже если многие киоски обращаются к одним и тем же производственным данным.

“В конце концов дело заканчивается массированным дублированием”,  -  отметил Инмон. И действительно, по оценкам фирмы Meta Group, суммарные административные расходы на содержание множества киосков данных могут в полтора раза превысить затраты на хранилище данных предприятия такого же масштаба.

При использовании разрозненных киосков возникает еще одна проблема: они часто выдают несовпадающие результаты. Причина? Неинтегрированные киоски используют различные модели данных, обычно в них различаются и структуры данных, например размерность кубов. Поэтому, даже извлекая данные из одного источника, они выдают несходные ответы на один и тот же запрос.

Джон Айзекс, директор группы приложений фирмы Cadence Design Systems (Сан-Хосе, шт. Калифорния), оказался из-за этого в затруднительном положении. Два года назад он приступил к разработке серии киосков финансовых данных. Однако выяснилось, что без единой модели данных эти киоски часто выдают разные результаты. “Нам казалось, что мы хорошо разбираемся в киосках данных, но уже на втором киоске эта иллюзия развеялась”,  -  вспоминает Айзекс. В результате пришлось назначить в каждое бизнес-подразделение по администратору, ответственному за систему поддержки принятия решений. Эти специалисты должны были наладить единое описание данных. Кроме того, группа Айзекса подготовила так называемые “золотые запросы”, т. е. заказные запросы, выполнение которых во всех киосках данных должно давать одинаковые результаты.

В организациях с разрозненными киосками данных возникают и проблемы с интеграцией так называемых метаданных. Метаданные  -  это информация о данных в хранилище или в киоске данных, например, из какого источника данные поступили в хранилище, когда они обновлялись последний раз или каким образом были реструктурированы. Если же киоски не объединены общей архитектурой, в них применяются индивидуальные способы сохранения и описания метаданных, которые зависят от используемого инструментария. В результате пользователи, которым нужен обзор данных  всего предприятия, вынуждены интегрировать метаданные самостоятельно, а каких-либо промышленных  стандартов, которые помогают сделать это, на сегодняшний день не существует.

Неходовая идея

Создать отдельный изолированный островок с киосками данных несложно, гораздо труднее объединить их в единую систему. Самая большая проблема  -  убедить руководство фирмы и прочих потребителей информации в том, что их киоски должны отвечать общей модели данных предприятия и другим стандартам. Эта идея часто воспринимается в штыки, ведь ее воплощение требует модификации киосков, которые, возможно, неплохо служат отдельным группам или специализированным подразделениям фирмы. Клаудиа Имхофф, президент фирмы Intelligent Solutions (Боулдер, шт. Колорадо), специализирующейся на консультациях в области хранения данных, сказала: “Это все равно, что убедить кого-либо в том, что он  должен принимать витамины. Все знают, что это нужно, но не видят быстрого результата. Поэтому идею создания архитектуры киосков данных очень важно внедрить на самом высоком уровне”.

Некоторые организации уже выходят на этот путь, начиная с самых простых шагов. Так, в фирме CKE были назначены администраторы БД, которые в тесном сотрудничестве с подразделениями провели планирование новых киосков данных. Кроме того, эти администраторы всячески поощряли менеджеров сливать, если это имело смысл, вновь создаваемые киоски с уже существующими.

Другие компании создают инфраструктуру, помогающую связать автономные киоски данных воедино. Консультант Ральф Кимбол приводит в пример некоторых своих клиентов, которые создают так называемые области организации данных (data staging area). Подобные структуры позволяет извлекать и преобразовывать исходные данные один раз, делая это стандартным способом, а затем передавать их в индивидуальные киоски данных. По мнению Кимбола, концепция в области организации данных во взаимодействии с моделями данных предприятия и интегрированными метаданными может вообще упразднить хранилища данных предприятия. “Я считаю, что киоски данных сами по себе составляют полноценное хранилище данных”,  -  убежден он.

Полезными в этом отношении функциями начинают оснащать свои продукты и производители инструментария. Например, такие специалисты по средствам извлечения данных, как корпорация Informatica, используют в своем инструментарии концепцию области организации данных. Ряд других производителей, включая корпорацию Sagent и фирму Prism Solutions, работают над тем, чтобы обеспечить взаимодействие своих инструментальных программ между собой. Фирма D2K (Сан-Хосе, шт. Калифорния) включила в свой инструментарий Tapestry репозиторий, в котором можно разместить метаданные из различных источников, в том числе и из приложений планирования ресурсов предприятия. Корпорация Microsoft действует на более высоком уровне: она пытается создать общий для всей индустрии стандарт интеграции метаданных. Однако этот проект пока находится лишь на стадии описания.

Поэтапный подход

Но  если в организации уже имеется много автономных киосков данных, ей в конце концов придется составить план перехода на более структурированные системы хранения информации  -  от такой необходимости ее не избавит даже обилие новых инструментов. Консультант Имхофф рекомендует избрать поэтапный подход. Начать лучше с тех шагов, которые окажутся наиболее политически приемлемыми в конкретной организации.

Планируемая архитектура хранилищ данных

Менеджерам информационных служб, например, следует для начала перевести все киоски данных на одну размерность и стандартизировать другие структуры. Это улучшит согласованность и позволит ограничиться минимальными изменениями в существующих киосках. Когда первый этап завершен, можно приступать к решению более сложных задач, таких, скажем, как внедрение во всех киосках единой модели описания данных или постепенный переход на описание киосков либо тематических областей (см. “Осуществление перехода”).

Те же организации, которые пока не попали в хаос киосков данных, могут позволить себе заняться созданием архитектурного  фундамента с самого начала, опираясь на рекомендации экспертов. Но это вовсе не означает, что на построение полномасштабной модели данных, пригодной для применения во всех киосках, можно затратить месяцы или годы. “Такой подход уже показал всю свою несостоятельность”,  -  предупреждает Кимбол.

Вместо этого Кимбол и другие специалисты рекомендуют менеджерам по информатизации вести работу поэтапно. Создайте руководящий комитет из представителей различных отделов фирмы, затем проведите одно- или двухдневное заседание и представьте им подробный план с указанием наиболее важных и критичных тематических областей. Выберите одну из них и приступайте к выработке соглашения о стандартном описании данных. “Отыщите самую больную точку, поставьте вопросы, ответы на которые хотел бы знать каждый, даже если все это покажется на первый взгляд очень мелким,  -  советует Дуг Хекни, президент консультационной фирмы Enterprise Group (Хадсон, шт. Висконсин).  -  После этого начинайте строить систему. Не позволяйте никому уклоняться в сторону унаследованных киосков. Если возникнет хотя бы один из них, он даст метастазы, а вы столкнетесь с крупными проблемами”.