Fujitsu объявила о разработке программной технологии, которая объединяет несколько графических процессоров (GPU, Graphics Processing Unit) для реализации преимуществ высокоскоростного глубинного обучения.

Глубинное обучение — это технология, которая демонстрирует гораздо более высокий уровень точности распознавания по сравнению с предыдущими разработками. Но для обеспечения высокой точности распознавания требуется постоянный анализ больших массивов данных. Для этого использовались графические процессоры, которые лучше подходят для высокоскоростных операций по сравнению с обычными центральными процессорами (CPU).

Как правило, для ускорения глубинного обучения требуется несколько компьютеров с мощными GPU, которые объединены в сеть и работают параллельно. Недостатком этой методики является то, что при объединении более 10 вычислительных машин увеличивается время обмена данными между компьютерами, и специалистам все труднее добиться эффекта параллелизма.

Fujitsu заново разработала технологию параллелизации, которая обеспечивает эффективный и быстрый обмен данными между компьютерами. Новая технология была протестирована в рамках платформы глубинного обучения Caffe. В рамках теста, измеряющего время обучения с помощью AlexNet и сети компьютеров с 64 GPU, новая разработка продемонстрировала скорость обучения, которая в 27 раз выше, чем при работе одного компьютера с одним GPU. По сравнению с результатами без использования новой технологии скорость обучения была увеличена на 46% для сети с 16 GPU и на 71% для 64 GPU. Эти показатели являются рекордными скоростями обработки данных. С помощью новой технологии задачи машинного обучения, для выполнения которых раньше требовался один месяц, теперь могут быть выполнены примерно за день в параллельном режиме работы 64 GPU.

В рамках разработки и внедрения двух новых технологий Fujitsu удалось увеличить скорость обработки данных при глубинном обучении.

Технология установки очередности обмена данными автоматически контролирует приоритет обмена данными для того, чтобы данные, необходимые для начала следующей сессии обучения, обменивались между несколькими компьютерами заблаговременно. В существующих технологиях обработка задач по обмену данными первого уровня, которые нужны для начала следующего процесса обучения, выполняется последней, что увеличивает задержку. В новой технологии, за счет выполнения обработки задач по обмену данными первого уровня во время обработки задач по обмену данными второго уровня, время ожидания сокращается.

Вторая технология обработки, которая оптимизирует рабочие операции в соответствии с размером данных. Для обработки данных, при которой результаты операций передаются всем компьютерами, и изначальный объем данных небольшой, каждый компьютер обменивается данными и затем выполняет такую же операцию, что позволяет устранить время, необходимое для передачи и получения результатов. Когда объем данных большой, обработка распределяется, и результаты обработки передаются другим компьютерам для последующих операций. За счет автоматического выбора оптимального метода на основе размера данных эта технология увеличивает общую скорость работы.

С помощью новой технологии можно сократить время исследований и разработок в области глубинного обучения, включая разработку уникальных моделей нейронной сети для автоматизированного управления роботами, автомобилями и пр. Кроме того, преимущества новой разработки можно применить в сфере финансов и здравоохранения, включая задачи по классификации патологий и прогнозирование биржевых курсов. Fujitsu планирует уже в 2016 году начать извлекать коммерческую выгоду из новой разработки в рамках проекта искусственного интеллекта Human Centric AI Zinrai.

Пресс-релиз

Версия для печати