ИНСТРУМЕНТАРИЙ

Несмотря на заметное повышение интереса заказчиков к средствам Business Intelligence (BI), следует признать, что деловая аналитика сегодня в большинстве своем сводится к выборке и визуализации фактических данных (чаще всего в виде двумерных, реже трехмерных зависимостей) с применением простейшей статистической обработки - вычисления тренда, определения корреляционной зависимости заданных параметров и пр. Именно поэтому основными вопросами в BI-тематике сейчас являются создание хранилищ данных, обеспечивающих оперативность выборки в онлайновом режиме, и построение отчетов. Средства же Data Mining*1, хотя о наличии таких функций декларируют многие поставщики BI-решений, находят себе гораздо меньшее применение.

_____

*1 Под термином "извлечение данных" в несколько упрощенной формулировке понимается возможность выявления скрытых закономерностей, неочевидных причин явлений и т. д. на основе математической обработки исходной информации, в том числе методами решения обратных задач.

В этой ситуации в ряду лидеров поставщиков BI-продуктов*1 особые позиции занимает компания SAS Institute, основу бизнеса которой изначально и в течение почти уже тридцати лет составляли и составляют технологии, базирующиеся на математических (в первую очередь статистических) методах "глубокой" обработки числовой информации. В конце марта компания объявила о начале вывода на рынок BI-системы нового поколения SAS9.

_____

*1 Нетрудно заметить, что за последние годы на ведущие позиции в данном сегменте, где ранее доминировали специализированные компании, выходят поставщики базовых технологий - Oracle, SAP, IBM, Microsoft.

Рассказывая о ней, директор по маркетингу московского представительства SAS Institute Александр Гвоздев отметил два важных момента. С одной стороны, он оценивает ее появление как наиболее значимое технологическое усовершенствование за всю историю компании, а с другой - речь идет об эволюционном процессе смены продуктов.

Как известно, семейство ПО SAS включает две категории продуктов: инструментальные и технологические средства для разработчиков и создаваемые на их основе решения для конечных пользователей. Представленная сейчас платформа SAS Intelligence Platform (SAS IP) - это как раз технологическая основа, на которой будет поэтапно возводиться весь комплекс SAS9. Фактически она полностью переписана с учетом использования новейших программных стандартов (Java, COM и пр.), возможности эффективной поддержки Web-среды и применения широкого круга клиентских устройств. В целом перед разработчиками SAS стояла задача обеспечить достижение высокого качества следующих характеристик системы:

- интероперабельности;

- масштабируемости и высокой производительности;

- управляемости;

- удобства использования.

Архитектуру SAS IP можно представить в виде трех слоев:

- ядро платформы, реализованное как набор серверов приложений (OLAP, Workspace, Metadata, Stored Process);

- сервисы и компоненты промежуточного слоя;

- клиентские приложения (на базе Java/Web).

С точки зрения пользователей платформы (в данном случае речь идет о разработчиках прикладных решений), наибольший интерес представляет ПО промежуточного слоя. Здесь также можно выделить две категории компонентов: большой набор базовых программных интерфейсов (см. рисунок) и интегрированные серверные решения верхнего уровня.

В настоящее время вторая группа SAS IP включает следующие продукты:

- Enterprise ETL Server, который осуществляет извлечение, преобразование и загрузку данных, используя различные механизмы доступа к разнообразным источникам информации, многопоточную обработку, интегрированную среду управления метаданными и графический интерфейс;

- Intelligence Storage - пакет, включающий реляционные, многомерные и параллельные средства хранения данных. Высокая производительность в нем достигается за счет применения записей фиксированной длины, укрупненного размера блоков данных и усовершенствованных алгоритмов индексирования;

- Enterprise BI Server, собирающий все необходимые для анализа данные вне зависимости от источника и формата, обеспечивая полноту, упорядоченность и достаточность очистки исходной информации;

- Analytic Intelligence, предоставляющий широкий спектр алгоритмов, средств анализа и методов моделирования.    

Визуальное проектирование процессов обработки данных в ETL-сервере

Все перечисленные средства могут быть расширены и настроены в соответствии со специфическими потребностями разработчиков и конечных пользователей. Это обеспечивается благодаря использованию открытых программных интерфейсов и широкого набора отраслевых стандартов.

Одновременно с выпуском SAS IP было объявлено о планах перевода на эту платформу всех существующих продуктов SAS для конечных пользователей. Первая семерка продуктов в новой технологической реализации - Marketing Automation, Risk Dimensions, Strategic Performance Management, Financial Managament Solutions, Supplier Relationship Management, Activity-Based Management и IT Management Solutions - появится в нынешнем году. Московское представительство уже начало работы по подготовке к локализации этих решений для российского рынка. С некоторыми из них отечественные заказчики смогут познакомиться ближе к осени, в частности в недавно открытом в Москве центре компетенции SAS (см. PC Week/RE, N 8/ 2004, с. 36).