В отдаленной перспективе машины на базе искусственного интеллекта будут познавать мир подобно детям, поглощая ограниченный объем данных, чтобы лучше их усвоить. Директор Cambridge Consultants по ИИ Тим Энсор рассказывает на портале Information Age о новых алгоритмических техниках и перспективах машинного обучения (МО) и ИИ.

Наблюдать за тем, как учится ребенок, — это необыкновенный опыт. Как гордого отца, меня это восхищает и вдохновляет, а как профессионала в области ИИ — заставляет осознать, что освоение МО только начинается. Что особенно невероятно в маленьких детях, так это то, что они невероятно быстро учатся, опираясь на строительные блоки информации и удивляя нас тем, что они воспринимают все естественно и постепенно. Не слишком ли многого мы требуем от машин?

На данный момент ответ утвердительный. Но необычайный прогресс, который я наблюдаю в области МО, убеждает меня в том, что конечная цель метаобучения — машины должны научиться учиться — становится все ближе. Последствия этого, конечно же, глубоки. Коммерческие возможности для бизнеса выйдут на новый уровень, общество будет развиваться, а этические, философские и моральные вопросы будут стоять на повестке дня в мире, где ИИ и поведение человека станут гораздо более тесными. Каково текущее состояние дел в области МО, и какие захватывающие последние разработки могут приблизить нас к тому, чтобы научить его учиться правильно?

Где мы сейчас находимся

На данный момент развитие ИИ можно сравнить с человеческим ребенком. Мы создаем новые для мира машины со сложными техническими характеристиками, обладающие огромными возможностями. Но чтобы раскрыть их потенциал, мы должны подвергнуть их сотням тысяч учебных примеров для каждой отдельной задачи. Они просто не «понимают» вещи так, как это делают люди. Один из способов заставить машины учиться более естественно — ограничить объем данных. Мы можем использовать генеративные состязательные сети (generative adversarial networks, GAN) для создания новых примеров на основе небольшого ядра обучающих данных вместо того, чтобы изучать каждую ситуацию в реальном мире. Эти сети являются «состязательными», потому что одна нейронная сеть противопоставляется другой для создания новых синтетических данных.

Помимо этого существует рендеринг синтетических данных — использование игровых движков или компьютерной графики для визуализации новых сценариев. Наконец, существуют алгоритмические техники, такие как Domain Adaption, которая предполагает использование переносимых знаний (например, использование летом данных, которые были собраны зимой) или Few Shot Learning, которая делает предсказания на основе ограниченного количества образцов. Другой путь использования ограниченного количества данных — многозадачное обучение, где общие черты и различия используются для решения нескольких задач одновременно.

Как правило, МО является контролируемым (с метками входных и целевых пар), но в настоящее время развиваются неконтролируемое, полуконтролируемое и самоконтролируемое обучение. Это касается обучения без необходимости маркировки всех примеров учителем-человеком. Например, при кластеризации алгоритм может объединить предметы в группы со сходством, которое может быть определено и обозначено человеком, а может и не быть. Проверка кластеров позволяет выявить мышление системы.

Трансформация трансформера

А теперь перейдем к Transformer, одному из новичков в этой области. Большинство алгоритмов нейронных сетей должны быть адаптированы для выполнения одной задачи. Архитектура Transformer делает меньше предположений о формате входных и выходных данных и поэтому может применяться для выполнения различных задач — это похоже на идею машин, использующих строительные блоки обучения. Изначально в качестве строительного блока для машинного перевода при обработке естественного языка Transformer использовал механизмы внимания. Но теперь он применяется и для других задач, таких как распознавание изображений и понимание трехмерного облака точек.

Это подводит к очевидному вопросу: куда Transformer двигаться дальше? Его применению наряду с эффективными методами обучения данных для исследования белковых соединений (на их базе разрабатываются антитела для лечения различных заболеваний, таких как диабет, рак, инфекционные заболевания, гемофилия и анемия) посвящена недавняя научная работа. Основываясь на этих исследованиях, команда Cambridge Consultants создала модель ИИ, которая может оптимизировать функцию белка для решения конкретной задачи. Мы применили ее к флуоресцентным белкам, а именно: можно ли рекомендовать белковые структуры, которые флуоресцируют более ярко. Не вдаваясь в детали скажу, что полученные результаты обнадеживают: модель предсказала варианты с шестью аминокислотными изменениями по всей длине последовательности для улучшения флуоресценции белка.

Это лишь проблеск захватывающего будущего. Манипуляции с белками могут найти применение в самых разных областях, включая медицину, где они могут быть использованы для улучшения лечения онкологических болезней или снижения уровня отторжения органов. С помощью экспериментов с белками могут быть созданы новые и более эффективные антибиотики. В области материалов этот метод может быть использован для более эффективной утилизации пластиковых отходов. Эта техника также может быть использована для создания текстильных изделий с лучшими эксплуатационными характеристиками.

Взгляд в будущее

А как насчет процесса обучения моделей ИИ в цикле экспериментов? По сути, это переворачивает с ног на голову традиционный подход «сначала данные — затем все остальное». Идея заключается в том, чтобы вместо данных начать с проблемы, и уже потом создавать необходимые наборы данных. Вы спрашиваете ИИ, что бы он хотел узнать, затем проводите лабораторный эксперимент, чтобы получить информацию, которую вы вводите в нейронную сеть. Это позволит заполнять любые пробелы в знаниях. Эта система находится на довольно ранней стадии разработки, цель которой — замкнуть цикл и автоматизировать весь процесс экспериментов.

Эту концепцию, например, применяют старший вице-президент, глобальный руководитель отдела ИИ и МО GSK Ким Брэнсон и его команда для создания новых лекарств. Их подход — сначала задать вопрос, а затем получить данные, необходимые для ответа на него, — позволяет им создавать уникальные наборы данных для проблем, которые они решают. Это мощная вещь, и она свидетельствует о том, что я сказал в самом начале: чем лучше машины будут учиться, тем лучше будут результаты для бизнеса, общества и всего мира.