Группа компаний РСК представила на международной выставке-конференции SC16 (Солт-Лейк-Сити, США) новое поколение своего сверхвысокоплотного, масштабируемого и энергоэффективного суперкомпьютерного решения «РСК Торнадо» с прямым жидкостным охлаждением (все элементы вычислительного шкафа охлаждаются жидкостью) на базе 72-х ядерного процессора Intel Xeon Phi 7290, самой старшей модели в этом семействе. Это решение РСК установило новый мировой рекорд вычислительной плотности для архитектуры x86 в 1,41 Пфлопс на шкаф, превысив прежнее достижение на 17% (ранее с 2013 года еще одному решению российской компании — RSC PetaStream — принадлежал мировой рекорд в 1,2 ПФЛОПС на шкаф). «РСК Торнадо» на базе многоядерных процессоров семейства Intel Xeon Phi 7200 обладает улучшенными показателями компактности и вычислительной плотности, высоким уровнем энергоэффективности, а также обеспечивает возможность стабильной работы вычислительных узлов в режиме «горячая вода» при температуре хладоносителя +63° С на входе в вычислительные узлы.

На стенде РСК были продемонстрированы вычислительный узел «РСК Торнадо» на базе многоядерного процессора Intel Xeon Phi 7290 на серверной плате Intel S7200AP с установленными двумя твердотельными дисками Intel SSD DC S3500 Series M.2 емкостью 340 Гб и одним Intel SSD DC P3100 (M.2 NVMe) с подключением по интерфейсу PCIe, а также коммутаторы и адаптеры для построения высокоскоростных межузловых соединений Intel Omni-Path (OPA) и Mellanox EDR InfiniBand.

РСК уже второй год подряд является технологическим спонсором немецкой студенческой команды Технического университета Мюнхена (TUM), снова участвующей в соревновании Student Cluster Competition (SCC), проводимом в рамках международной суперкомпьютерной выставки SC16. В ходе SCC студенческие команды должны продемонстрировать жюри свои познания и практические навыки в области суперкомпьютерных архитектур и повышения производительности программно-аппаратных комплексов путем оптимизации запуска различных научных приложений и тестов на вычислительном кластере, энергопотребление которого не должно превышать лимит в 3120 Вт. Российская компания предоставила в распоряжение этого молодежного коллектива 8-ми узловой кластер, реализованный в мобильном исполнении на базе архитектуры «РСК Торнадо» с прямым жидкостным охлаждением. В составе конфигурации этой вычислительной системы, обеспечивающей стабильную работу узлов в режиме «горячая вода» при температуре хладоносителя до +63° С на входе: 72-х ядерные процессоры Intel Xeon Phi 7290, серверные платы Intel S7200AP, твердотельные диски Intel SSD DC S3500 Series M.2 емкостью 340 Гб, коммутатор и адаптеры на основе высокоскоростного межузлового соединения Intel Omni-Path, модули памяти Micron DDR4-2400 VLP емкостью 16-32 Гб.

РСК также продемонстрировала решение на базе протокола NVMe-over-Fabric, который позволяет организовать высокоскоростной удаленный доступ к дисковому массиву. Его отличительной особенностью является использование средств RDMA высокоскоростного межузлового соединения Intel Omni-Path для минимизации задержки доступа к блочному устройству. Так, на стенде РСК был представлен мини-кластер, в котором вычислительные узлы получают дисковое пространство по требованию от централизованного сервера с NVMe-дисками Intel SSD DC P3700. Такой подход позволяет проектировать кластерные решения высокой плотности, в которых вычислительные узлы имеют ограниченное дисковое пространство с возможностью его расширения через NVMe-over-OPA в реальном времени. Стоит отметить, что решение на базе протокола NVMe-over-Fabric не является заменой традиционным системам хранения в HPC, таким как Lustre, однако, может считаться дисковым ускорителем для оптимизации задач, связанных со случайным доступом к данным.

Новое поколение кластерного решения «РСК Торнадо» отличают следующие улучшенные показатели: использование многоядерных процессоров семейства Intel Xeon Phi 7200, в том числе старших моделей Intel Xeon Phi 7290 (до 72-х ядер) и возможность использования будущих процессоров Intel Xeon Phi 7250F, Intel Xeon Phi 7290F (суффикс F для версий процессоров с интегрированным высокоскоростным межузловым соединением Intel Omni-Path); использование новых серверных плат семейства Intel Server Board S7200AP; высочайшая физическая плотность с размещением до 408 вычислительных узлов в двухстороннем шкафу 42U с размерами 120×120×200 см; рекордная вычислительная плотность — 1,41 Пфлопс (ранее 528 Тфлопс для данного решения) в двухстороннем вычислительном шкафу 42U или более 490 Тфлопс/м3; энергетическая плотность до 200 кВт/шкаф позволила, за счет снижения энергопотребления системы, повысить энергоэффективность почти в 3 раза; увеличение объема оперативной памяти решающего поля вычислительных узлов одного шкафа почти в 5 раз с 16,3 Тб в предыдущем поколении до 76,5 Тб (до 192 Гб оперативной памяти типа DDR4-2400 RAM и 16 Гб MCDRAM на узел); одновременное использование до двух твердотельных накопителей с подключением по шине SATA и одного PCIe в форм-факторе M.2, таких как Intel SSD DC S3500 и Intel SSD DC P3100 (M.2 NVMe); повышенный уровень энергоэффективности — обеспечены необходимые условия для стабильной работы вычислительных узлов в режиме «горячая вода» при температуре +63 °С на входе в вычислительные узлы, что позволяет реализовать работу системы в режиме «фрикулинга» 24 ч Х 365 дней в году, что позволяет обеспечить PUE системы менее 1,05; новый модуль электропитания в форм-факторе вычислительного узла, обеспечивающий высокоэффективное преобразование 220 В переменного тока в 400 В постоянного тока (эффективность конверсии питания составляет 96%) и возможность параллельной работы на общую шину с резервированием от N+1 до N+N; обновленная конструкция вычислительного шкафа с поддержкой новых технологий высокоскоростных межузловых соединений, включая Intel Omni-Path и Mellanox EDR InfiniBand; обеспечена возможность построения гибких конфигураций систем охлаждения, с возможностью резервирования, как отдельных узлов гидрорегулирования, так и всей системы в целом; любой узел решения «РСК Торнадо» может обслуживаться индивидуально и не требует остановки какого-либо другого узла. Удобный доступ ко всем компонентам узла (памяти, дискам, адаптерам высокоскоростных межсоединений, подсистемам управления и электропитания) позволяет легко произвести замену этих компонент или их реконфигурирование прямо на площадке заказчика.

Кроме того, кластерное решение «РСК Торнадо» может быть реализовано и на базе серверных процессоров семейства Intel Xeon E5-2600, включая представленную на SC16 старшую модель Intel Xeon E5-2699A v4 (22 ядра, тактовая частота 2,40 ГГц, 55 Мб кэш-памяти L3), обеспечивая высокую вычислительную плотность — 258,5 Тфлопс в стандартном вычислительном шкафу 42U (80×80×200 см).

Высокая доступность, отказоустойчивость и простота использования вычислительной системы также обеспечиваются благодаря передовой системе управления и мониторинга, реализованной в решениях РСК для высокопроизводительных вычислений. Она позволяет осуществлять управление как отдельными узлами, так и всем решением в целом, включая инфраструктурные компоненты. Все элементы комплекса (вычислительные узлы, блоки питания, модули гидрорегулирования и др.) имеют встроенный модуль управления, что обеспечивает широкие возможности для детальной телеметрии и гибкого управления. Конструктив шкафа позволяет заменять вычислительные узлы, блоки питания и гидрорегулирования (при условии применения резервирования) в режиме горячей замены без прерывания работоспособности комплекса. Большинство компонентов системы (таких, как вычислительные узлы, блоки питания, сетевые и инфраструктурные компоненты и т.д.) представляет из себя программно-определяемые компоненты, позволяющие существенно упростить и ускорить как начальное развертывание, так и обслуживание, и последующую модернизацию системы. Жидкостное охлаждение всех компонентов обеспечивает длительный срок их службы.

Передовые технологические подходы, реализованные в новом поколении суперкомпьютерного решения «РСК Торнадо», позволили уменьшить стоимость инфраструктуры в рамках реализации проектов создания вычислительных комплексов и обеспечить возможности для более гибкой модернизации, как на уровне отдельного узла, так и всей системы в целом.

Таким образом, решения РСК для высокопроизводительных вычислений де-факто продолжают устанавливать высокие стандарты в отрасли для показателей физической и вычислительной плотности, энергоэффективности, надежности, доступности и управляемости.

Решения на базе разработанных специалистами компании передовых суперкомпьютерных архитектур «РСК Торнадо» и RSC PetaStream с жидкостным охлаждением находятся в промышленной эксплуатации у российских заказчиков с 2009 и 2013 годов соответственно. Такие решения установлены и активно используются для моделирования и расчетов широкого спектра научно-исследовательских и реальных промышленных задач в Санкт-Петербургском политехническом университете Петра Великого (СПбПУ), Межведомственном суперкомпьютерном центре Российской Академии Наук (МСЦ РАН), Южно-Уральском государственном университете (ЮУрГУ), Московском физико-техническом университете (МФТИ), Росгидромете и у других заказчиков из различных отраслей промышленности.