Для тех, кто закончил изучение химии в школе, она останется в воспоминаниях цветными опытами в пробирках и колбочках и яркими экспериментами с пиротехническими эффектами (впрочем, кого-то, возможно, огорчали неприятные ароматы, необходимость составления уравнений реакций и решения задачек). Однако те, кто продолжал овладевать этой наукой в вузе, увидел, что опыты в пробирках - это удел школьников. Химия сегодня - это не просто опыты с растворами в пробирках и пиротехнические эффекты, - современная наука оперирует такими методами, как рентгеноструктурный анализ, спектроскопия, хроматография, ядерный магнитный резонанс, квантово-химические подходы, с которыми связаны не только задачи моделирования процессов и структур, а также соответствующие теоретические построения, но и огромный объем вычислений.
Заведующий лабораторией химической
кибернетики профессор Александр Немухин
Химический факультет МГУ им. М. В. Ломоносова (www.chem.msu.ru) сегодня располагает неплохой компьютерной базой: у него своя локальная сеть (входящая в состав университетской), к которой подключено около 400 пользователей. Компьютерный парк факультета насчитывает более 500 машин; учебный процесс и потребности сотрудников обеспечиваются также тремя компьютерными классами. Полтора года назад здесь появилась уникальная учебно-научная единица - вычислительный кластер, состоящий из 18 машин и сервера. Химический факультет оказался одним из победителей конкурса, объявленного представительством компании Intel в странах СНГ и Балтии в рамках корпоративной Академической программы, осуществляемой в этом регионе с 1997 г. По условиям конкурса преимущество получали проекты, которые предусматривали целенаправленное внедрение в учебный процесс новых возможностей, предоставляемых современными информационными технологиями (видео, аудио, трехмерная графика, Интернет), а также подготовку специалистов, способных эффективно применять соответствующий инструментарий. На конкурс был представлен 51 проект от четырех ведущих московских вузов - МГУ им. М. И. Ломоносова, МГТУ им. Н. Э. Баумана, МИФИ и МФТИ. Из авторов 23 проектов, заявленных Московским университетом, обладателями грантов Intel (сумма каждого - около 80 000 долл.) стали два факультета: факультет вычислительной математики и кибернетики (ВМК) с проектом “Учебно-исследовательская лаборатория компьютерной графики и машинного зрения” (руководитель - доцент, доктор физ.-мат. наук Ю. М. Баяковский) и химический факультет (точнее, кафедра физической химии химфака), представивший проект “Высокопроизводительные компьютерные технологии в физической химии” (руководитель - зав. кафедрой физхимии академик В. В. Лунин). Результаты конкурса были объявлены в июле 1999 г., а в ноябре на химфаке состоялось торжественное открытие компьютерного класса, где разместился новый программно-аппаратный комплекс. Однако победе в конкурсе предшествовала серьезная работа, часть которой проводилась в сотрудничестве с компанией Intel в рамках объявленной ею в России Академической программы.
Из истории сотрудничества с Intel
“Наше сотрудничество с Intel началось еще в 1998 г., - рассказал научный сотрудник Лаборатории химической кибернетики (ЛХК) Александр Грановский, - на основе общего интереса к высокопроизводительным вычислениям. Дело в том, что с 1993 г. мы работаем с пакетом GAMESS (General Atomic and Molecular Structure System, разработчики - группа Марка Гордона, Университет штата Айова, США), который активно используется для квантовохимических расчетов. Это некоммерческое ПО его создатели распространяют в виде исходных текстов при условии регистрации и заполнения специальной анкеты. Наша работа с данным пакетом включала не только вычисления, на которые он рассчитан, но и собственные разработки - от адаптации и оптимизации реализованных в нем алгоритмов под платформу Intel (вплоть до полного их “переписывания”, использования языков более низкого уровня и т. д.* ) до создания новых алгоритмов и методов расчета, по сути - новых функциональных возможностей системы, основанных на наших теоретических исследованиях. Сюда можно отнести функцию поддержки SMP, высокопрецизионные методы расчета (в частности, высшие порядки теории возмущений, позволяющие получать высококачественные оценки энергии и равновесной геометрии молекулярных систем). То, что получилось в результате, - наш вариант пакета - мы называем PC GAMESS.
Три года назад мы почувствовали реальную помощь со стороны Intel и активизировали работы по созданию новых алгоритмов и поддержке параллельных вычислений в сетях, а в 1999 г. компания предоставила ЛХК четыре мощные машины - наш первый (“маленький”) кластер - и подписала с нами контракт на дальнейшие работы по PC GAMESS”.
Intel также заинтересована в развитии подобных разработок - в самой компании несколько исследовательских групп занимаются различными аспектами высокопроизводительных вычислений. В частности, некоторые из них работают над созданием высокопроизводительных библиотек под архитектуру Intel (например, BLAS - Basic Linear Algebra Subroutines, библиотека манипулирования с векторами и матрицами, важная для исследований, где используются матрично-матричные, матрично-векторные и векторно-векторные операции). При создании PC GAMESS сотрудники ЛХК также обращались к BLAS и другим высокоэффективным библиотекам Intel.
Совместные работы помогли партнерам лучше узнать друг друга, и когда Intel объявила конкурс 1999 г., ЛХК и химфак решили непременно принять в нем участие. Как было сказано выше, победа в конкурсе принесла химикам возможность шире развернуть как научную, так и учебную деятельность.
А теперь - посчитаем
Вычислительный кластер, установленный на химфаке, сегодня используется как для квантово-химических расчетов (главным образом с помощью PC GAMESS) и дальнейшего усовершенствования этого пакета, так и для занятий студентов и аспирантов кафедры и факультета, а также при выполнении дипломных работ. В течение многих лет уже при наборе студентов на первый курс формируются две специальные группы, которые курирует кафедра физической химии: одна - с усиленной подготовкой по дисциплинам физико-химического цикла и строению молекул, другая - по вычислительным методам в химии. Для них очень важно в процессе обучения освоить современные программные средства, помогающие проводить квантово-химические расчеты и при этом хорошо понимать механизм их работы. Для этого помимо теоретических курсов необходимы практикумы и лабораторные занятия.
Компьютерный класс, в котором установлен
вычислительный кластер из 18 машин
“В основе квантовой химии лежит идея получения информации о веществе с помощью неэмпирических расчетов, - пояснил профессор Александр Немухин, возглавляющий ЛХК, - и основным методом здесь является решение уравнений квантовой теории для атомной или молекулярной системы. Разумеется, существует немало способов их приближенного решения, квантовая химия располагает своим набором средств для этого. Наша цель - на практике познакомить студентов с различными методами, границами и условиями их применения. Возьмем, например, молекулу воды - с методической точки зрения очень удобный объект. На ней можно продемонстрировать фактически любые методы расчетов (в том числе и те, которые для больших молекул нереализуемы из-за огромной сложности вычислений), показать их достоинства и недостатки.
Еще один пример - молекула адамантана. При исследованиях по кинетике адсорбции возникла необходимость выяснить распределение зарядов в данной молекуле (оно влияет на очень многие свойства молекул); подобные расчеты, кстати, достаточно востребованы в квантовой химии. Они были предложены одному из студентов в качестве задачи практикума. Для этого он должен был понять, какая точность от него требуется, выбрать соответствующий метод расчета (необходимое приближение), затем составить входной файл, в который закладывается информация о конкретной молекулярной системе и о том, какими методами расчета надлежит воспользоваться, и наконец запустить программу. После этого выполнение задачи заняло всего 10 минут.
Однако основная идея построения нашего вычислительного кластера заключалась в отработке параллельных вычислений, когда задействованы все или часть машин кластера. Не так давно мы проводили для лаборатории нашей кафедры расчет частот колебаний одного из производных фуллерена CH. Задача выполнялась на 14 машинах в течение восьми с половиной суток. Одновременно в классе шли занятия со студентами, поэтому приоритет задачи был немного понижен. В задачах подобного типа масштабируемость обычно очень хорошая, и можно сказать, что на одной машине данный расчет занял бы времени почти в 14 раз больше.
Еще один пример - наши собственные тестовые расчеты, позволяющие оценить как возможности кластера, так и возможности PC GAMESS. Это высокопрецизионные расчеты, отвечающие четвертому порядку теории возмущений с полным учетом всех возбужденных состояний и требующие очень большого объема вычислительных ресурсов. Нам было необходимо выяснить, сколько гигафлоп мы можем на практике получить от кластера и какова масштабируемость наших алгоритмов. Мы получили очень неплохие результаты: на 18 компьютерах зафиксировали 17,6-кратное ускорение. Кроме того, подобные задачи важны для нас как возможность проверки алгоритмов на способность предельного распараллеливания расчетов и равномерного распределения нагрузки на машины”.
Приходится заботиться о равномерности нагрузки компьютерного класса и в другом смысле, связанном с расписанием. Оно составлено таким образом, что дневные часы первых трех-четырех дней в неделю посвящены занятиям со студентами и аспирантами; конец же недели отведен на научные исследования, связанные с тематикой ЛХК, а также с разработкой PC GAMESS. На выходные дни, как правило, оставляется либо одна большая задача, которая считается параллельно на всех машинах, либо несколько задач (для каждой выделяется несколько машин).
А в перспективе так много интересного
Помимо занятий со студентами и аспирантами и возрастающего потока заказов на расчеты от других лабораторий кафедры, в планах сотрудников ЛХК - дальнейшее развитие PC GAMESS. На сегодняшний день у него уже около 500 пользователей по всему миру. Регулярно выпускаются новые версии, а сейчас идет работа над реализацией и включением в пакет новых прецизионных методов расчета на основе разработанных в ЛХК алгоритмов. Планируется дальнейшее развитие поддержки новых поколений процессоров и SMP-систем. Недавно была создана Linux-версия пакета. И наконец, весьма перспективны и будут продолжены конкретные исследования по квантовой химии, которые ведутся всеми сотрудниками лаборатории (и в большинстве случаев - при помощи пакета PC GAMESS).* Изначально пакет Gamess US реализован на языке Фортран.
Лаборатория химической кибернетики
Основателем и первым заведующим ЛХК (www.lcc.chem.msu.ru) был академик В. И. Спицын. С 1993 г. она входит в состав кафедры физической химии. Основные направления исследований ЛХК - математическое моделирование свойств веществ и реакционной способности самыми разнообразными методами квантовой теории строения и статистической физики, а также развитие методов планирования эксперимента и обработки экспериментальных данных. Профессор химфака Александр Немухин, возглавляющий ЛХК с 1993 г., считает, что современная химическая наука невозможна без подобного моделирования.
Состав и характеристики вычислительных кластеров ЛХК
“Маленький” кластер:
четыре компьютера, каждый из которых имеет:
- два 500 МГц Pentium III Xeon (1 Мб кэша второго уровня)
- 512 Мб ECC PC100 SDRAM
- RAID-контроллер Mylex 1164 Extreme
- четыре жестких диска LVD SCSI-3 (IBM DRVS 9 Гб)
Общее дисковое пространство - 130 Гб
Общая пиковая производительность - 4 Гфлоп
ОС Windows NT 4.0
Вычислительный кластер в компьютерном классе:
Восемнадцать рабочих станций, каждая из которых имеет:
- 500 МГц Pentium III
- 256 Мб ECC PC100 SDRAM
- два жестких диска ULTRA-ATA (11 Гб каждый, ULTRA-2 DMA mode)
Один сервер:
- четыре 550 МГц Pentium III Xeon (1 Мб кэша второго уровня)
- ECC RAM объемом 4 Гб
- RAID-контроллер Mylex 1164 Extreme
- четыре жестких диска LVD SCSI-3 (IBM DMVS 9 Гб)
Общее дисковое пространство - 428 Гб
Общая пиковая производительность - 11,2 Гфлоп
ОС Windows NT 4.0