Нынешним летом компания Google расширила спектр корпоративных облачных услуг, предложив крупным клиентам — предъявляющим повышенные требования к конфиденциальности — доступ к особо защищённым виртуальным машинам. Физической основной для нового сервиса стали решения на платформе AMD EPYC 2-го поколения.

Стали не по какой-то прихоти поставщика облачных услуг, а из чисто прагматических соображений: на сегодня только эти процессоры готовы обеспечить аппаратную поддержку защищённой шифрованной виртуализации (secure encrypted virtualization, SEV) при высочайшем уровне производительности, с минимальными задержками и внушительной масштабируемостью. Плюс к тому, у новейших серверных ЦП AMD имеется целый ряд архитектурных преимуществ, позволяющих заказчикам получать больше отдачи от серверов на каждый вложенный рубль или доллар.

Безопасные облака для крупных клиентов

Крупные заказчики по всему миру осознают выгоду от использования облачных услуг не в меньшей мере, чем средние и малые. Однако цена любой ошибки либо промаха для больших корпораций существенно выше, и потому они предъявляют особые требования к обеспечению безопасности любых транзакций, выходящих за пределы их локальной ИТ-инфраструктуры. Наладить в канале связи с сервис-провайдером сквозное шифрование — дело технически нехитрое, однако при огромных объёмах данных (а именно такими объёмами оперируют крупные заказчики) в силу потребности непрерывно кодировать и раскодировать мегабайты информации каждую секунду нагрузка на вычислительную платформу поставщика услуг становится непомерной.

Безусловный (на данный момент) лидер серверного х86-рынка, компания Intel, специально для решения подобного рода задач разработала процессоры с набором инструкций SGX (software guard extensions): те позволяют формировать прямо в виртуальной памяти «островки безопасности», надёжно защищённые от любых попыток проникновения извне и связанные с ИТ-инфраструктурой заказчика прямым шифрованным каналом. Однако у технологии SGX есть немало узких мест, самое неприятное из которых с точки зрения больших корпораций — ограничение на предельный объём выделяемой для «островка безопасности» памяти: всего лишь 92 Мбайт. Это заметно ограничивает применимость таких процессоров для построения высокозащищённых облачных платформ, — впрочем, альтернативы им нет.

Точнее, не было — до тех пор, пока AMD не представила рынку свои новейшие серверные ЦП EPYC 2-го поколения с аппаратной поддержкой шифрованной виртуализации SEV.

С точки зрения организуемого Google нового сервиса эти процессоры выигрывают хотя бы тем, что обеспечивают возможность выделять для «островков безопасности» на порядок больше виртуальной памяти — до 896 Гбайт. При этом производительность решения остаётся на высоте: интенсивное применение сквозного шифрования снижает их производительность в среднем на 5%, максимум на 10%. К тому же серверы на базе процессоров AMD обходятся заказчику на 10-15% дешевле по сравнению с аналогичными машинами Intel. Неудивительно, что финансовый директор AMD Девиндер Кумар (Devinder Kumar) озвучил в середине лета амбициозную цель — занять не менее 10% рынка серверов уже в нынешнем году. Напомним, что ещё в 2018-м эта доля едва превышала 1%.

Экономия и ускорение

Сопоставлять напрямую цены на схожие по формальной производительности процессоры, безусловно, имеет смысл — в качестве первой, приближённой оценки. На практике же производительность серверных приложений определяет не некая абстрактная величина, полученная зачастую на синтетических тестах, а тонкости архитектурного устройства чипов, для не специализированного на ИТ заказчика нередко остающиеся за кадром. Однако хотя бы на базовом уровне иметь представление об этих тонкостях необходимо — иначе попросту непонятно, по каким критериям действительно имеет смысл сравнивать между собой разные ЦП.

Взять, например, количество физических ядер в серверном процессоре: чем их больше, тем лучше для существенно многопоточных приложений вроде веб-серверов, СУБД, трансляций потокового видео и т. п. Если задача хорошо масштабируется, то фактическая производительность её определяется максимально доступным для приобретения числом процессорных ядер в серверной стойке. И в этом плане новинки AMD дают чипам семейства Xeon хорошую фору: ещё первое поколение EPYC позиционировалось разработчиком как возможность использовать односокетный сервер там, где до той поры требовался двухсокетный. 64 физических ядра в одном процессоре и, соответственно, 128 независимых вычислительных потоков — уже внушительное преимущество, и это далеко не предел возможностей архитектуры EPYC.

Мало того, что односокетный сервер сам по себе дешевле двухсокетного.

Множество разновидностей дорогостоящего ПО (Citrix Hypervisor, Red Hat Virtualization, VMWare vSphere и т. п.) лицензируется по количеству процессорных сокетов — и потому на односокетной машине такой софт будет демонстрировать более высокую производительность за существенно меньшую цену. С другой стороны, немало прикладного ПО, в том числе для решения требовательных к «железу» бизнес-задач, рассчитано на исполнение в строго определённом числе параллельных потоков, — нескольких сотен или даже тысяч. Организовать нужное число потоков при использовании более многоядерных, чем решения Intel, процессоров EPYC удаётся при меньшем количестве серверов и серверных стоек— что, опять-таки, оборачивается для заказчика чистой экономией.

Ещё один приятный момент, повышающий акции AMD EPYC: конструктивно это система-на-кристалле (SoC), и потому отдельная микросхема системной логики — чипсет материнской платы, «южный мост», — ей не требуется. Это удобно даже при традиционном использовании ЦП, когда в системе развёртывается ОС непосредственно на «железе», но в полную силу это преимущество раскрывается в задачах виртуализации. Поскольку физически все контроллеры устройств (SATA, USB и т. п.) располагаются вместе с процессорными ядрами на едином чипе, виртуализовать их и предоставить к ним прямой доступ из виртуальных машин, исполняемых на гипервизоре, значительно проще, чем в случае физически обособленного «южного моста». «Проще» в контексте высоконагруженных серверных приложений значит — «требует меньше системных ресурсов» и «способствует общему повышению производительности».

Единственное, пожалуй, препятствие, которое может возникнуть у заказчика, решившего вот прямо сегодня начать приобретать серверы на EPYC 2-го поколения вместо новеньких Xeon, — это невозможность (точнее, чрезвычайная затруднённость) миграции созданных под процессоры Intel виртуальных машин на оснащённые AMD системы. Поскольку виртуальная машина эмулирует аппаратные особенности ЦП вплоть до набора расширенных инструкций, а наборы эти у двух вендоров различны (AES у AMD, AES-NI у Intel, не говоря даже о SEV и SGX), миграция виртуальных машин внутри кластера с серверами на различных ЦП либо вовсе невозможна, либо оборачивается существенным снижением производительности.

В этом случае крупные заказчики применяют блочный подход, практикуемый провайдерами облачных услуг: сервера с выделенными для них СХД и сетевым оборудованием группируются в блоки, и динамическая миграция виртуальных машин по мере необходимости производится исключительно внутри блока. Соответственно, и заменять/апгрейдить оборудование в ЦОДе по мере выработки им штатного ресурса также следует цельными блоками. Вряд ли стоит сомневаться, что по мере завершения жизненного цикла используемых в настоящее время процессоров Xeon всё больше корпоративных заказчиков по всему миру будут развёртывать в своих ЦОДах серверные блоки на основе AMD EPYC 2-го поколения.

Основа для развития

AMD EPYC представляет собой систему-на-кристалле — и потому может показаться, что от выбора системной платы для него мало что зависит. Действительно, «южного моста» здесь нет, есть только процессорное гнездо и токоведущие дорожки от него к слотам расширения и контроллерам периферии (Ethernet, USB, BMC). Но это вовсе не умаляет значимости материнской платы как базы для построения всей серверной системы целиком. Если база несовершенна — производитель сэкономил на слоях текстолита, на изоляции сигнальных шин от наведённых помех, на качестве схемотехнических элементов, — пиши пропало: подлинно высоких результатов от собранного на этой плане сервера добиться не выйдет.

Подтверждением тому служат результаты испытаний серверов, оснащённых процессорами AMD EPYC серии 7002 (Rome) в составе серверных рэк-платформ GIGABYTE: двухсокетной R282-Z90 и односокетной R272-Z30. С использованием 64-ядерного (128-поточного) процессора EPYC 7742 эти платформы ещё в августе 2019 г. установили сразу 11 мировых рекордов производительности в специализированных серверных тестовых пакетах SPEC CPU 2017 и SPECjbb2015. Установили, вне всякого сомнения, благодаря давно присущему продукции GIGABYTE высокому качеству инженерного дизайна и исполнения как системных плат, так и компьютерных платформ в целом.

SPEC CPU 2017 представляет собой набор бенчмарков (SPECrate и SPECspeed) для определения производительности сверхтребовательных к процессорным ресурсам приложений. Среди реальных задач подсерии тестов SPECrate наиболее соответствуют высокопроизводительные многопоточные вычисления (high performance computing, HPC), тогда как SPECspeed максимизирует однопоточную нагрузуку и наилучшим образом эмулирует работу приложений финтеха вроде high frequency trading (HFT). По итогам проведённых испытаний, подтверждённых на официальном ресурсе spec.org, сервер GIGABYTE R282-Z90 с AMD EPYC 7742 стал безусловным лидером в номинациях SPECrate 2017 Integer Rate Base, SPECrate 2017 Integer Rate Peak, SPECrate 2017 Floating Point Rate Base и SPECrate 2017 Floating Point Rate Peak для двухсокетных систем, а сервер GIGABYTE R272-Z30 с AMD EPYC 7742 первенствовал в зачётах SPECrate 2017 Floating Point Rate Base, SPECrate 2017 Floating Point Rate Peak и SPECspeed 2017 Floating Point Rate Peak.

SPECjbb 2015 — бенчмарк для определения производительности корпоративных Java-приложений, особенно актуальных для заказчиков из сфер e-commerce и обработки больших данных. По итогам исполнения этого набора тестов сервер GIGABYTE R282-Z90 с двумя процессорами AMD EPYC 7742 поставил рекорд производительности среди двухсокетных систем сразу в четырёх испытаниях: SPECjbb2015 MultiJVM max-jOPS, SPECjbb2015 MultiJVM critical-jOPS, SPECjbb2015 Composite max-jOPS и SPECjbb2015 Composite critical-jOPS.

С точки зрения корпоративных заказчиков, имеющих дело с высоконагруженными приложениями, наибольший интерес представляет, конечно же, двухсокетная серверная платформа GIGABYTE R282-Z90. Рассчитанная на установку двух 7-нм процессоров AMD EPYC серии 7002 (типичный теплопакет — 225 Вт, предельный — 240 Вт), она предлагает 8-канальный контроллер оперативной памяти RDIMM/LRDIMM DDR4 для каждого из ЦП, всего до 32 модулей DIMM. Системная плата MZ92-FS0 включает два порта 1Gb/s LAN на базе контроллеров Intel I350-AM2 и один выделенный порт мониторинга и управления.

Платформа высотой 2U предусматривает 24 отсека для установки 2,5-дюймовых накопителей NVMe с поддержкой горячей замены прямо с фронтальной панели, а также два отсека для 2,5-дюймовых HDD/SSD с интерфейсами SATA/SAS на тыльной панели. Возможна установка сверхскоростного накопителя M.2 с интерфейсом PCIe Gen3×4; имеются два слота расширения PCIe Gen4. Для удалённого управления предусмотрен контроллер Aspeed AST2500, а энергоснабжение системы осуществляет блок питания на 1600 Вт, отвечающий спецификации 80 PLUS Platinum.

Для оптимизации управления сервером (точнее, всеми серверами данного вендора в пределах локальной сети) предлагается бесплатное фирменное ПО GIGABYTE Server Management (GSM), включающее интерфейс командной строки, графическую оболочку с наглядным представлением состояния и загруженности доступных серверов, а также приложение для удалённого доступа со смартфона и плагин для мониторинга серверов из VMware vCenter.

Решения на базе AMD EPYC 2-го поколения с использованием серверных платформ GIGABYTE чрезвычайно привлекательны для корпоративных заказчиков — в особенности крупных, которым существенно важна оптимизация стоимости оборудования и развёрнутого на нём ПО при максимально возможном количестве процессорных ядер в стойке. Особый интерес подобные решения вызовут у клиентов с повышенными требованиями к информационной безопасности получаемых ими облачных услуг.

Кейс компании Uma.Tech

Компания заказала в ASBIS серверы на базе платформы GIGABYTE R272-Z30 в следующей конфигурации: материнская плата MZ32-AR0, процессор AMD EPYC 7302P, оперативная память DDR4 16GB RDIMM 2933 (8 шт., всего 128 Гбайт), HDD: 8 Tb SATA 7,2k (4 шт.), SSD: 240 Gb SATA SSD 2,5’’, графический адаптер: NVIDIA Tesla T4 (3 шт.).

«Используем серверы под задачи кодирования видео в 4K, а также для вычислений статистики в спортивных событиях, cv & ml, — говорит Никита Ломакин, руководитель отдела инженерной инфраструктуры Uma.Tech. — Проводили и тестирование платформы в роли кэш-сервера». Преимущества серверов с процессорами AMD EPYC на платформе GIGABYTE, отмеченные заказчиком, — это хорошее охлаждение в конфигурации с 2-5 мощными графическими адаптерами, а также использование однопроцессорных платформ в случае выполнения основных операций на GPU, которые на уровне ЦП почти не поддаются распараллеливанию и потому не нуждаются в двухпроцессорных системах.

ПОДГОТОВЛЕНО ITWEEK EXPERT