Брайан Деллабетта, старший инженер ML-DevOps в Zapata Computing, рассказывает на портале The New Stack о потенциале совместного применения машинного обучения и квантовых вычислений.

У каждого из нас есть свои проверенные и верные способы повысить продуктивность и сосредоточиться. Я вырос в доме, наполненном музыкой 60-х, видеоиграми и бейсбольными трансляциями. Наверное, неудивительно, что за свою карьеру, в ходе которой я менял занятия между вычислительной физикой, разработкой приложений, наукой о данных и инженерией, но всегда кодировал, я полюбил работать с включенной в фоновом режиме игрой.

Для меня эти вещи просто сочетаются. То же самое касается квантовых вычислений и машинного обучения.

Мотивация совместного применения квантовых вычислений и машинного обучения

Квантовые вычисления предлагают совершенно новый способ думать о вычислениях. Классический мир вычислений — мир микросхем, дискретной логики и наборов инструкций — очень хорошо подходит для бизнес-логики и информационных систем. Маловероятно, что ситуация изменится, даже если появится отказоустойчивый квантовый компьютер. Но мир природы не основан на дискретной логике и утверждениях «if/else».

Классические вычисления так долго были единственным способом вычислений, что бывает трудно осознать существование принципиально иных подходов, не говоря уже о том, что они могут сделать некоторые задачи чрезвычайно простыми для квантового компьютера (а другие — чрезвычайно сложными).

МО является отличным испытательным полигоном, поскольку оно не относится к миру систем правил или дискретной логики, и существует множество нерешенных проблем, связанных с существующими методами.

Невозможно отрицать, что МО процветает и получило огромное распространение в индустрии, особенно за последние 15 лет. Тем не менее, многие модели стали настолько сложными и громоздкими, что, как говорится в недавней статье в IEEE Spectrum, исследователи в области МО, возможно, «приблизились к границе того, чего могут достичь их инструменты».

Почему наш мозг намного эффективнее и надежнее обрабатывает изображения, чем новейшие и лучшие модели глубокого обучения? Не усложняет ли наш подход относительно простые вычисления?

Мы свободны в своих исследованиях, но ограничены своими предпосылками. От деревьев решений до регрессии — наследие классических вычислений сразу же проявляется в МО. Даже нейронные сети, которые включают активирующий слой, когда входной сигнал превышает определенный порог, напоминают поведение транзистора. Для любого нового подхода нам необходимо переосмыслить каждую часть алгоритма обучения, от кодирования данных до подготовки архитектуры, обучения на наборе данных и декодирования результата.

Все это ставит очень интересную и уникальную задачу. Но есть и подсказка: предпосылки для квантового машинного обучения (QML, КМО) и большинства современных архитектур корпоративных данных во многом совпадают. В то время как алгоритмы будут меняться, способ управления жизненным циклом данных и моделей (на стороне бизнес-логики) вряд ли изменится.

Изменения постоянны — как в жизни, так и в MО (и КМО)

Важно помнить о динамической природе MО. Исследования постоянно развиваются и совершенствуются за счет новых архитектур и алгоритмов, поэтому КМО, в некотором смысле, является движущейся мишенью. Наша общая обязанность — следить за исследованиями в обеих областях, чтобы понимать плюсы и минусы каждой из них и предлагать гибридные архитектуры, использующие преимущества обеих, при этом сравнивая их с лучшими в своем классе классическими алгоритмами.

Быть квантовым ученым — не обязательное условие

Так же, как инженеру MО не нужно знать физику полупроводников, лежащую в основе поведения транзисторов, инженерам КМО не нужно знать квантовую физику конкретной аппаратной реализации. Вместо этого мы можем сосредоточиться на имеющихся в нашем распоряжении элементарных операциях, которые в классических и квантовых вычислениях называются гейтами, чтобы создавать приложения для конечных пользователей, которые могут быть использованы кем угодно.

Приложения и методы КМО должны быть настолько удобными для пользователя, насколько это возможно. Рассмотрим примеры классических библиотек машинного обучения PyTorch и TensorFlow, где не обязательно знать, как работает метод обратного распространения ошибки, чтобы эффективно использовать его и получать реальные результаты. То же самое относится и к хорошему программному обеспечению КМО.

При всем этом, безусловно, существуют различные степени сложности в зависимости от сферы применения и отрасли. Если вы посмотрите на работу, которая ведется в вычислительной химии или некоторых других физических науках, то это совсем другой язык, другой словарный запас и гораздо более научная база знаний.

Важны именно модели

За пределами управления данными МО на предприятии занимается поиском моделей или архитектур нейронных сетей, которые наилучшим образом соответствуют набору данных и инсайтам, которые вы надеетесь извлечь из них. Эти модели могут быть классическими, квантовыми или использовать гибридный подход. В целом, процесс включает следующие шаги:

  • Все начинается с набора данных и цели. Что мы надеемся узнать из этого проекта?
  • Исследование — что происходит с набором данных? Насколько он «чист», и как много нужно сделать, чтобы привести его к стандартному формату? (Поговорка о том, что 95% работы специалиста по аналитическим данным — это поиск и очистка данных, абсолютно верна.)
  • Инжиниринг характеристик — какие аспекты набора данных важны? Содержат ли данные признаки, которые можно сопоставить с желаемым результатом или меткой? Для обучения надежной модели может потребоваться интеграция информации из других источников данных.
  • Создание модели — какие алгоритмы или архитектуры могут быть наиболее полезны? Здесь в игру вступают гибридные архитектуры и КМО.
  • Обучение — существует множество инструментов для настройки гиперпараметров, позволяющих автоматизировать этот процесс и убедиться, что вы получаете максимальную отдачу от модели.

После идентификации эти сценарии использования могут быть запущены в производство. Модель — это живой организм, точно так же, как ПО — живой организм. Вы всегда будете обновлять ее, создавать версии и подстраивать под новые функции, новые наборы данных или новые гиперпараметры. Для этого жизненного цикла необходим проверенный в боях и автоматизированный конвейер MLOps.

Все развивается быстрее, чем вы думаете

Новизна и потенциал квантовых вычислений, как и MО до них, делают их интересным направлением исследований. На примере графики и скорости видеоигр, в которые я играл подростком, трудно поверить, насколько резко все может измениться за короткий промежуток времени. Когда я учился в аспирантуре, квантовые вычисления были лишь несбыточной мечтой. Сегодня им посвящена целая индустрия.

Никогда еще квантовые вычисления не привлекали столько внимания со стороны экспертов в области МО, численной оптимизации и квантового моделирования. Влияние КМО будет расти вместе с нашим теоретическим пониманием, так же как и с аппаратным обеспечением. Мы находимся на неизведанной территории.