В 2022 г. мы увидим всю многоликость искусственного интеллекта: в фокусе будут такие темы, как аппаратное обеспечение, периферия, MLOps, языковые модели, будущие архитектуры и этика, пишет на портале ZDNet обозреватель Джордж Анадиотис.

В принципе, к ИИ следует подходить комплексно. Учитывать положительные и отрицательные стороны, от восхитительного до обыденного, от аппаратного до программного обеспечения. В последние несколько лет «железо» было постоянной темой в рамках более широкой темы ИИ, и мы считаем, что это хорошая отправная точка для нашего экскурса.

В последние пару лет мы следим за растущим списком поставщиков «ИИ- чипов», то есть компаний, которые с нуля разработали новые аппаратные архитектуры, предназначенные специально для рабочих нагрузок ИИ. Все они стремятся получить кусок, казалось бы, постоянно растущего пирога: поскольку ИИ продолжает расширяться, рабочие нагрузки продолжают увеличиваться, и их надо обслуживать как можно быстрее и экономичнее.

Nvidia продолжает доминировать в этой сфере. Компания была на рынке задолго до того, как рабочие нагрузки ИИ начали расти, и у нее хватило ума и рефлексов извлечь из этого выгоду, создав экосистему аппаратного и программного обеспечения. Ее прошлогодняя попытка по превращению Arm в часть этой экосистемы все еще находится под пристальным рассмотрением регуляторов. Однако Nvidia не осталась в стороне и в 2021-м.

На мероприятии Nvidia GTC в ноябре 2021 г. компания сделала ряд анонсов, который реализуют на аппаратном уровне фокусные направления развития ИИ — выводы и периферию. Были представлены улучшения Triton Inference Server, а также представлен A2 Tensor Core GPU, маломощный и занимающий мало места ускоритель для ИИ-вычислений на периферии, который, по утверждению Nvidia, обеспечивает в 20 раз большую производительность вычислений, чем CPU.

А что насчет новичков? SambaNova заявляет, что сейчас она является «самым финансируемым в мире стартапом в области ИИ». После получения 676 млн. долл. в рамках серии D финансирования ее оценка превысила 5 млрд. долл. Философия SambaNova заключается в том, чтобы предлагать ИИ как сервис, — теперь включая языковые GPT-модели, для которых, похоже, 2021-й стал временем реального выхода на рынок.

Xilinx, со своей стороны, заявляет о достижении значительного ускорения нейронных сетей по сравнению с графическими процессорами Nvidia. Cerebras утверждает, что «абсолютно доминирует» в high-end-вычислениях, и также получила значительное финансирование. Graphcore конкурирует с Nvidia (и Google) в результатах MLPerf. Tenstorrent наняла легендарного дизайнера чипов Келлера. Blaize привлекла 71 млн. долл. для внедрения ИИ в промышленные приложения. Flex Logix получила 55 млн. долл. в виде венчурной поддержки, в результате чего ее общая сумма достигла 82 млн. долл. И последнее, но не менее важное: в нашей гонке есть новая лошадь в лице NeuReality, предлагающей способы смешивания и совмещения развертывания в ONNX и TVM, а также обещающей использовать ИИ для разработки ИИ-чипов. Разве это не бум инноваций?

Согласно отчету Linux Foundation «State of the Edge», к 2028 г. цифровое здравоохранение, промышленность и розничная торговля с высокой вероятностью расширят использование периферийных вычислений. Неудивительно, что аппаратные средства, фреймворки и приложения ИИ, ориентированные на Edge, также становятся все более популярными.

TinyML, искусство и наука создания моделей машинного обучения, достаточно экономных для работы на периферии, быстро растет и создает экосистему. Edge Impulse, стартап, который хочет сделать МО на периферии доступным для всех, только что объявил о финансировании серии B в размере 34 млн. долл. Периферийные приложения на подходе, и ИИ и его аппаратное обеспечение станут большой частью этого процесса.

То, что стало заметным в 2021 г. и будет с нами в ближайшие годы, — это так называемый MLOps — доведение машинного обучения до производственных операций. В уходящем году люди пытались дать названия различным явлениям, связанным с MLOps, нарезать область MLOps на кусочки, применить контроль версий данных и непрерывное МО, а также эквивалент разработки на основе тестирования для данных. Акцент смещается с блестящих новых моделей на, возможно, более рутинные, но практические аспекты, такие как качество данных и управление конвейером данных, и MLOps будет продолжать расти.

Другая вещь, которая, вероятно, будет продолжать расти как в плане размера, так и в плане количества, — это большие языковые модели (LLM). Некоторые люди считают, что LLM могут усваивать основные формы языка, будь то биология, химия или человеческий язык, и мы скоро увидим рост их необычных применений. Другие считают иначе. В любом случае, LLM распространяются.

Помимо «привычных подозреваемых» — OpenAI с его GPT3, DeepMind с его последним RETRO LLM, Google с его постоянно расширяющимся набором LLM — Nvidia теперь объединилась с Microsoft в Megatron LLM. Но это еще не все.

Недавно EleutherAI, коллектив независимых исследователей ИИ, выложил в открытый доступ свою модель GPT-j с 6 млрд. параметров. Кроме того, теперь у нас есть большая европейская языковая модель от Aleph Alpha, свободно владеющая английским, немецким, французским, испанским и итальянским языками. Wudao — это китайская LLM, которая также является самой большой LLM с 1,75 трлн. параметров, а HyperCLOVA — это корейская LLM с 204 млрд. параметров. Кроме того, всегда есть другие, немного более старые/меньшие опенсорсные LLM, такие как GPT2 или BERT и его многочисленные вариации.

DeepMind и Google намекнули на революционные архитектуры для моделей ИИ — Perceiver и Pathways, соответственно. Pathways критикуют за довольно расплывчатые формулировки. Однако мы рискнем предположить, что она может быть основана на Perceiver. Но поскольку мы находимся на территории технологий будущего, было бы упущением не упомянуть о нейроалгоритмическом обосновании DeepMind — направлении исследований, обещающем объединить классические алгоритмы информатики с глубоким обучением.

Ни один экскурс в ИИ, каким бы сжатым он ни был, не будет полным без почетного упоминания этики ИИ. Она оставалась актуальной в 2021 г., и мы видели, как самые разные люди — от членов правительственных комиссии до практиков отрасли — пытаются по-своему решать эти вопросы. И не стоит забывать о продолжающемся буме применения ИИ в здравоохранении — области, в которой этика должна быть главным приоритетом — с ИИ или без него.