Yandex B2B Tech выпустила новую версию системы управления базами данных YDB. В ней появился векторный поиск — технология, которая умеет искать не по ключевым словам, а по смыслу. Она в первую очередь пригодится компаниям, которые развивают продукты на базе искусственного интеллекта. Например, с её помощью можно повысить точность рекомендаций товаров или качество ответов ИИ-ассистента. Технология доступна как в облаке, так и локально — по модели on-premises.

Векторная технология предусматривает представление данных, по которым ведётся поиск, в виде числовых векторов, или эмбеддингов. Сравнивая векторы, можно определить семантическую близость соответствующих им объектов. Такой подход даёт целый ряд преимуществ: от возможности устанавливать неочевидные связи между объектами и искать по разнородным данным — скажем, текстам, картинкам, видеороликам и аудиофайлам — до устойчивости к ошибкам и опечаткам.

«Сейчас ИИ-ассистентов внедряют у себя компании практически из всех отраслей. Наша технология позволяет создавать ассистентов на архитектуре RAG (Retrieval-Augmented Generation) — когда ответ большой языковой модели дополняется данными из баз знаний. В таких базах может содержаться, например, документация к продукту или ответы поддержки. Векторный поиск позволяет находить в базах необходимую информацию и добавлять её в ответы LLM. Это означает, что ассистент будет давать более полные, релевантные и актуальные ответы без какого-либо дообучения большой языковой модели», — отметил Андрей Фомичев, технический директор YDB.

Технологию векторного поиска уже использует AI-ассистент Алиса. Те, у кого есть опция «Про», могут попросить её учитывать при составлении ответов свои предпочтения и интересы. Опираясь на них, Алиса подстраивается под пользователя и ведёт диалог в персонализированной манере — почти как живой собеседник.

В YDB доступны две версии векторного поиска: точный и приближённый. Точный поиск обеспечивает наилучший результат, но требует сложных вычислений, если данных много. Приближённый поиск позволяет искать по миллиардам векторов за десятки-сотни миллисекунд — даже если корпус векторов не помещается в оперативную память. Такую возможность в мире предоставляют лишь несколько компаний.

YDB развивает векторный поиск при поддержке созданного Яндексом Фонда технологических инициатив — YATF. Он вкладывается в новаторские проекты внутри компании — такие, которые способны продвинуть вперёд науку и технологии. В 2025 году на это выделено 330 млн руб. Подробнее об устройстве векторного поиска можно прочитать в блоге «Яндекса» на «Хабре».