Об этом Андрей Вылегжанин, заведующий отделом информационного обеспечения и телекоммуникаций петербургского Физико-технического института им. А.Ф. Иоффе, рассказал во время апрельской онлайн-конференции «Суперкомпьютерные вычисления для прогресса исследований по управляемому термоядерному синтезу и астрофизике».

Директор ФТИ, профессор Сергей Иванов после упоминания о том, что 2021-й объявлен в России Годом науки и технологий, пояснил: «Недавно наш институт, который дал стране пять нобелевских лауреатов, перешагнул свой столетний юбилей. Но первые суперкомпьютеры появились в нем лишь 60 лет назад, то есть в тот год, когда свой знаменитый полет в космос совершил Юрий Гагарин. Они, в основном, предназначались для решения задач в области атомной физики и газовой динамики. Важно отметить, что многопрофильные исследования, которые проводятся в ФТИ, практически невозможны без использования высокопроизводительных вычислений (HPC). Мы всегда находились на передовом фронте не только фундаментальных, но и прикладных исследований. Однако в последние 10-20 лет очень сильно возросли скорости разработки инновационных направлений, что, в свою очередь, требует быстрого наращивания суперкомпьютерных мощностей».

По его словам, некоторое время институт сильно проигрывал ведущим зарубежным научным центрам в области оснащения новейшей суперкомпьютерной техникой. Но ситуация изменилась в 2019 г., когда в рамках национального проекта «Наука» была запущена программа 50%-ного обновления приборной базы ведущих организаций, выполняющих научные исследования и разработки«.

Как рассказал Андрей Вылегжанин, суперкомпьютерная система с применением жидкостного охлаждения электронных компонентов «РСК микроЦОД», выполненная на базе архитектуры «РСК Торнадо» и предназначенная для высокопроизводительных вычислений, была установлена в ФТИ в сентябре минувшего года. Она включает 20 вычислительных узлов, использующих серверные процессоры Intel Xeon Scalable 2-го поколения (модели Intel Xeon Gold 6248R), а также серверные платы Intel Server Board S2600BPB и твердотельные накопители Intel SSD. Для высокоскоростной передачи данных между вычислительными узлами использовалась технология коммутации Intel Omni-Path. Эта система сразу же вошла в рейтинг Top50 самых мощных суперкомпьютеров России и СНГ (46-я позиция). При этом её пиковая производительность составила 92,16 Тфлопс, а максимальная производительность на индустриальном тесте LINPACK — 66,13 Тфлопс.

Если говорить коротко, программно-аппаратный комплекс «РСК микроЦОД» представляет собой сверхкомпактный, энергоэффективный и полностью готовый к работе дата-центр в одной стойке, устанавливаемый в любые, практически неподготовленные, помещения. Одной из причин выбора ФТИ данного решения стали существующих ограничений для серверных помещений и лимит на подведенное электропитание. Немалую роль сыграло и то, что при нехватке вычислительной мощности данный комплекс позволяет запускать решаемые задачи во внешних суперкомпьютерных центрах.

По словам Андрея Вылегжанина, в институте существует 14 групп HPC-пользователей. Они используют как программы собственной разработки — написанные на языках C++, Fortran и/или Python и удовлетворяющие спецификациям OpenMP (Open Multi-Processing) и/или MPI (Message Passing Interface) — так и готовые пакеты для научных расчетов:

  • LAMMPS,GROMACS (молекулярная динамика);
  • OpenFOAM (механика сплошных сред);
  • Quantum ESPRESSO, ABINIT, WIEN2k (квантовая химия);
  • GENE, FIDASIM (физика плазмы).

В ФТИ утверждают, что с «РСК микроЦОД» одновременно может работать любое количество специалистов. При этом доступ к нему обеспечивается через стандартные средства удаленного доступа к UNIX-like системам.

Так как вычислительной мощности имеющегося у ФТИ 20-узлового варианта HPC-кластера «РСК микроЦОД» специалистам института уже не хватает, то предполагается увеличить количество узлов этого кластера до максимально возможного. Предполагается, что 12 новых узлов будут использовать недавно анонсированные серверные процессоры Intel Xeon Scalable 3-го поколения, которые изготовлены с использованием технологического процесса 10 нм и обеспечивают значительный прирост производительности — в среднем на 46% в распространенных рабочих нагрузках для ЦОДов по сравнению с предыдущим поколением.

Директор по развитию корпоративных проектов Intel в России Николай Местер обратил внимание на то, что Xeon Scalable 3-го поколения также получили ряд новых и расширенных платформенных возможностей, таких как встроенная система безопасности с поддержкой технологии Intel SGX, ускорение криптографических вычислений с технологией Intel Crypto Acceleration и ИИ-вычислений с технологией Intel DL Boost. Предполагается, что эти новые возможности в сочетании с широким выбором специализированных инфраструктурных решений Intel Select Solutions и Intel Market Ready Solutions позволят заказчикам ускорить развертывание решений в облачных и корпоративных средах, а также в системах для высокопроизводительных вычислений и искусственного интеллекта.