2005 год стал знаменательной датой для индустрии хранилищ данных — был преодолен рубеж объёма прикладной базы в 100 Тб. Согласно ежегодному отчёту “TopTen Program” аналитической компании Winter Corporation, отслеживающей крупнейшие проекты в этой области, объём реляционной БД, обрабатываемой механизмами каталога Yahoo, достиг 100,386 Тб. В качестве платформы в проекте задействована СУБД Oracle. Немного отстала от победителя система компании AT&T — 93,876 Тб. Интересно, что она использует платформу Daytona оригинальной разработки. Всего же в списке четыре системы на базе Oracle и Unix/Linux, две на базе Daytona/Unix, две на базе IBM DB2/Unix и по одной — на базе MS SQL Server/Windows и Sybase/Unix. Впервые в десятку вошли системы на основе Linux (24,8 Тб) и Windows (19,5 Тб).
В то же время исследования Winter Corporation не охватывают ряд областей, где, например, информация накапливается, но обрабатывается не очень интенсивно. Так, в ряде общественных и научных проектов ведется сбор “сырых” данных, просто активный их анализ не выполняется. В частности, архив Интернета составляет около 2 Пб (Пб – тысяча Тб) и растёт на 20 Тб в месяц. Примерно такой же объём накоплен физиками из Лаборатории высоких энергий Ферми в США, а также в рамках проекта НАСА по исследованию Земли EOSDIS, где БД геофизических сведений о нашей планете вырастает за сутки на 3 Тб.
Ещё пять лет назад эксперты Winter Corporation предсказали экспоненциальный рост максимального размера отслеживаемых ими коммерческих БД, и в точном соответствии с их прогнозом в 2001 г. максимально задействованный объем составлял 10 Тб (сегодня же рядовое видеохранилище, коих в Сети немало, содержит 8 Тб), в 2003-м — 30 Тб, в 2005-м — 100 Тб. Соответственно, в 2006 г. он достигнет 300 Тб, а через пару лет в прикладных проектах будет преодолён порог в петабайт! Вырастут требования к СУБД и по другим характеристикам: сегодня крупнейшим OLTP-системам приходится обрабатывать 1 млрд. SQL-запросов в час, а количество записей в БД Yahoo достигло 2,8 трлн. (в пять раз больше, нежели в 2003-м).
Поэтому, без сомнения, с проблемой стремительного роста корпоративных БД в ближайшие годы столкнется множество крупных организаций по всему миру. Вместе с тем доступные СУБД масштабируются на петабайты не очень эффективно — как минимум, процесс этот будет дорогостоящим и потребует суперсерверов или мэйнфреймов. Имеются ли достойные альтернативы?
Один из возможных вариантов предлагает Стив Шин, вице-президент корпорации Sybase, ответственный за регион EMEA. Он в середине ноября посетил Москву и выступил на семинаре, посвященном выходу новой версии СУБД Adaptive Server Enterprise (ASE) 15.0. Этот продукт стал на сегодня самым крупным инвестиционным проектом Sybase.
Интересно, что последней моделью сервера была ASE 12.5. Версии 13 и 14 были опущены потому, что, по версии маркетологов Sybase, 13 — несчастливое число в западном мире, а 14 — в восточном регионе и в Китае, откуда, кстати, родом генеральный директор корпорации и где эта СУБД активно используется. Россию же г-н Шин посетил в связи с тем, что на недавнем совете директоров к ключевым регионам, где в ближайшие 2–3 года произойдет взрывной рост объёмов БД, наряду с Индией и Китаем была отнесена наша страна.
Стив Шин обещает решить все проблемы с базами данных |
СУБД ASE 15.0, движок которой был полностью переделан, должна, по заверениям вице-президента, решить все подобные проблемы на ближайшие 10 лет. Кроме того, ASE для Windows и Linux по совокупной стоимости владения дешевле любых своих конкурентов. Конечно, ASE не соревнуется с ведущими СУБД на “тяжёлом” оборудовании и дорогих платформах, но обыгрывает DB2, MS SQL Server и Oracle по TCO минимум на 15% на многопроцессорных Intel-машинах среднего класса (оценки Standish Group и IDC можно найти на сайте www.sybase.com/ase15/). Показательны и такие факты: Голубой гигант на новой Linux-платформе IBM OpenPower решил задействовать ASE, а не собственную СУБД IBM DB2, а корпорация SAP выбрала ASE в качестве базовой для своей стратегической платформы Business One.
ASE 15.0 способна работать с информацией объемом тысячи терабайтов (теоретический предел — 1 млн. Тб, или 1 Эб; общий объем всех печатных материалов на Земле составляет 5 Эб). Она также поддерживает до 2 млрд. дисковых устройств по 4 Тб и показывает 80%-ный рост производительности в сравнении с ASE 12.5 (на сложных запросах и неоптимизированных БД за счёт интеллектуального оптимизатора выигрыш может достигать сотен раз). Максимальный размер отдельной БД вырос с 8 до 32 Тб, появилась возможность прямого доступа к файлам по аналогии с обработкой “сырых” неформатированных данных. В системе реализованы вычисляемые колонки и индексы-функции, а “умные” разделы позволяют оптимизировать размещение и обработку данных. Появились в ASE и “умные” транзакции, что делает эту СУБД не только мощным OLTP-движком, но и средством для построения DSS-служб поддержки принятия решений. Важно, что ASE дополнилась долгожданной интегрированной средой разработки WorkSpace.
В августовском отчете “Database Encryption Solutions Scorecard Summary” аналитической фирмы Forrester сервер ASE был также отмечен за качественный механизм шифрования. Алгоритмы безопасности теперь встроены в ядро продукта, поддерживаются технологии SSL и LDAP-аутентификации, а способ шифрования таблиц и отдельных колонок надежно скрывает (делает нечитаемым) содержимое полей даже от системных администраторов, которым приходится часто копировать таблицы и архивировать БД. Согласно статистике, 70% краж информации сегодня осуществляется изнутри предприятий, и продукты, подобные ASE 15.0, помогут избежать ситуации, когда базы данных налоговых служб, пенсионных фондов или сотовых операторов массово продаются в пиратских ларьках.