Предприятия, использующие публичные облака, не удивляются плате за исходящий (egress) трафик, но эти затраты могут резко взлететь в случае размещения данных в гибридном облаке и особенно при их использовании, пишет президент консультативной фирмы CIMI Том Нолл на портале TechTarget.

Архитектура гибридного облака привлекает многие предприятия. Но они не понимают, что при этом возникает проблема с размещением и перемещением данных.

Гибридные облака спроектированы так, чтобы нагрузка распределялась между частным ЦОДом и публичным облаком. Предприятиям необходимо разобраться, где хранить данные и как получать к ним доступ, а также позаботиться, чтобы выбранная стратегия не нарушала работу приложений.

Стратегии размещения и перемещения данных

Где бы вы не разместили данные для приложений гибридного облака, они, скорее всего, будут пересекать границы облака, что может повлечь за собой взимание платы за пользование облаком и сетью. Стоимость перемещения данных между облаком и ЦОДом будет зависеть от объема данных и может составлять сотни тысяч долларов в месяц.

Типичное гибридное приложение использует облако в качестве внешнего источника транзакции, а ЦОД для обработки транзакции. Имеются два базовых подхода к размещению данных в гибридном облаке:

  1. хранить данные в облаке и предоставлять к ним доступ посредством размещенных в ЦОДе компонентов приложения;
  2. хранить данные в ЦОДе и предоставить доступ к ним облачным компонентам приложения.

Возможно также совмещение этих двух подходов.

В большинстве публичных облаков плата взимается за хранение и за исходящий трафик. Входящий (ingress) трафик обычно оплачивать не приходится. Поэтому вы захотите, чтобы больше данных поступало в облако из ЦОДа, чем в обратном направлении. Если приложение предоставляет пользователю больше данных, чем получает, лучше разместить данные в ЦОДе.

Общее правило моделирования гибридных данных заключается в том, чтобы не производить дисковые операции ввода-вывода с пересечением границ облака. В противном случае будет создаваться большой платный трафик. Таким образом, при создании облачной базы данных не стоит моделировать дисковые операции чтения-записи.

Вместо этого вы направляете запрос к СУБД и получаете от нее результат. Это устраняет необходимость пересылать каждую запись базы данных через облачный интерфейс, чтобы определить, отвечает ли она заданным критериям.

Первое, что необходимо учитывать при планировании гибридных данных, это специфический характер обмена запросами и ответами. Важно также, какую плату взимает ваш облачный провайдер за данные и их перемещение.

Соображения по поводу размещения СУБД

Проблема с размещением гибридных данных в облаке заключается в том, что независимо от масштабирования внешних облачных компонентов проверка и обработка транзакций будет зависеть от подключения к единственной СУБД в ЦОДе. Кроме того, это не позволит делать резервные копии размещенных в ЦОДе компонентов, поскольку шлюз доступа к данным будет находиться в ЦОДе и, вероятно, будет взломан, если эти компоненты выйдут из строя.

В подавляющем большинстве случаев предприятия занимаются в своих ЦОДах аналитикой, подготовкой отчетов для регуляторов и планированием бизнеса. Маловероятно, что компании перенесут СУБД в облака, поскольку это значительно увеличит плату за исходящий трафик. Однако, если гибридные облачные приложения используют базы данных небольшого размера, они могут работать параллельно в обеих средах. Только необходимо позаботиться, чтобы эти базы данных обновлялись синхронно.

Иногда облачный внешний интерфейс приложений может нуждаться только в некоторых проверочных обращениях к базе данных. Например, для проверки номера счета. Для подобных случаев следует рассмотреть возможность хранения в облаке урезанного экземпляра базы данных (summary database), содержащего только важнейшие сведения. Такие экземпляры могут быть также полезны, если предприятия применяют облачные аналитические приложения для данных, которые обычно хранятся в ЦОДах. Историческая аналитика часто не требует ни последних обновлений, ни полной базы данных. Все, что сокращает количество записей или объем данных в записи, будет снижать затраты на хранение.

Использование данных

Планируя размещение СУБД в гибридном облаке, следует подумать об использовании данных в вашей компании. Многие забывают, что подготовка регулярных отчетов и аналитика ad hoc часто требуют более интенсивного использования базы данных, чем обработка транзакций.

Соотношение «запрос-результат» для отчета и аналитики отличается от соотношения для транзакций. Из-за оплаты исходящего трафика пользователей как бы штрафуют за действия, в результате которых большой объем данных извлекается из облака. Если передавать транзакционные данные в облако можно бесплатно, то передача в обратном направлении ответов на те маленькие запросы ad hoc, которые генерируют объемные результаты, может вызвать дополнительные расходы.

Особенно важно, чтобы приложения для подготовки отчетов и проведения аналитики, получающие доступ к облачным СУБД, также работали в облаке. Это позволит избежать оплаты исходящего трафика.

Последствия для сети

Чем больше трафик между различными вычислительными средами, тем выше нагрузка на VPN-соединение с облаком. Это тоже будет стоить денег. В некоторых случаях соединение с облаком будет конкурировать по стоимости с исходящим трафиком. При планировании размещения данных учитывайте все расходы и определите их маршруты.

Пока облачные провайдеры и операторы сетей не предложат передавать трафик бесплатно, экономическая обоснованность использования облачных приложений будет зависеть от того, как вы размещаете и передаете данные.