Даже в компаниях с отдельными подразделениями специалистов в области науки о данных внедрение искусственного интеллекта не может обойтись без ИТ-специалистов, пишет на портале InformationWeek Мэри Шеклет, президент консалтинговой компании Transworld Data.

Интеграция ИИ изменяет бизнес-процессы и методы работы сотрудников, но она также требует интеграции с ИТ-инфраструктурой и системами. Именно этим будут заниматься самые технически подкованные ИТ-сотрудники, и они захотят обсудить с CIO подходы и идеи интеграции технологий. Большинство CIO не являются инженерами-программистами, но они обязаны обладать рабочими знаниями в области ИТ, чтобы вести содержательные диалоги со своими наиболее технически подкованными сотрудниками, помогая им определять направление развития технологий. Что CIO нужно знать о технической стороне интеграции ИИ?

1. Техническая интеграция ИИ — это внедрение ИИ в системы и рабочие процессы

Предполагается, что к тому моменту, когда ваши сотрудники приступают к техническому проектированию и принятию решений по инструментарию, бизнес-кейс и область применения ИИ уже определены. Теперь задача состоит в том, чтобы решить, как осуществить техническое внедрение и интеграцию ИИ в ИТ-инфраструктуру и приложения, которые будут поддерживать бизнес-процессы.

2. Моделирование — прежде всего

Системы ИИ строятся на основе моделей, которые используют хранилища данных, алгоритмы для запросов и машинное обучение, расширяющее объем знаний ИИ, поскольку ИИ распознает общие логические шаблоны в данных и усваивает знания из них. Существует множество различных моделей ИИ. В большинстве случаев компании используют предопределенные модели ИИ, предлагаемые поставщиками, и затем расширяют их. В других случаях компании предпочитают создавать собственные модели «с нуля».

Построение «с нуля» обычно означает, что в организации есть штатная группа специалистов в области науки о данных, обладающая опытом построения моделей ИИ. Распространенные фреймворки для построения моделей ИИ (например, Tensorflow, PyTorch, Keras и др.) предоставляют программные ресурсы и инструменты.

Эти технологии построения моделей ИИ не знакомы большинству ИТ-специалистов. В них используются графы данных для построения потоков данных и структур, которые определяют, как данные будут перемещаться по графу. При этом необходимо определить операционные потоки для логики, оперирующей данными. ПО для построения моделей также обеспечивает разработку алгоритмов, обучение моделей, определение бизнес-правил и МО, которое модель выполняет самостоятельно, «обучаясь» на основе поступающих данных.

ИТ-специалисты могут не знать этих вещей, но они не могут позволить себе игнорировать их. И им, и CIO необходимо иметь хотя бы рабочее представление о том, как работают технологии создания Open Source-моделей, поскольку эти модели неизбежно должны взаимодействовать с ИТ-инфраструктурой и данными.

3. Далее следует ИТ-инфраструктура

Как интегрировать систему ИИ с существующей ИТ-инфраструктурой — вот где CIO могут ожидать серьезного диалога со своими техническими специалистами.

Для того чтобы ИИ работал, он должен быть бесшовно интегрирован с технологическим стеком сверху донизу. Это означает, что необходимо обсудить, как и где будут храниться данные, полученные от ИИ, причем фаворитами в этом вопросе являются базы данных SQL и NoSQL. Необходимо обеспечить взаимодействие с промежуточным ПО, которое позволяет ИИ взаимодействовать с другими ИТ-системами. Большинство моделей ИИ имеют открытый исходный код, что может упростить интеграцию, но для интеграции все равно необходимо использовать промежуточные API, такие как REST, который интегрирует систему ИИ с интернет-ресурсами; или язык запросов GraphQL, который облегчает интеграцию данных из нескольких источников.

Именно ИТ-отдел решает, как развернуть оптимальные хранилища данных, инфраструктуру хранения и коннекторы, необходимые для поддержки ИИ, и, скорее всего, существуют различные варианты (и стоимость) развертывания. Именно здесь CIO необходимо наладить диалог с техническим персоналом.

4. Качество данных

ИИ-группа будет полагаться на ИТ-отдел в обеспечении качественных данных для ИИ. Это достигается путем обеспечения «чистоты» всех данных, поступающих в хранилище данных ИИ (т. е. данные преобразованы с помощью ПО типа ETL, они точны и могут взаимодействовать с другими данными в хранилище данных ИИ); при этом данные безопасны (т. е. зашифрованы в точках передачи или проверены на границах каждого ресурса, через который должны пройти данные). Работа с внешними поставщиками, проверка поставщиков на чистоту и безопасность данных и их периодический аудит или определение преобразований данных, технологий и операций безопасности, которые должны быть внедрены внутри компании, — все это входит в обязанности ИТ-отдела. CIO придется вести диалог на техническом уровне с поставщиками, а также с ИТ-группами по базам данных, хранению, безопасности, системам, приложениям и сетям.

5. Безопасность ИИ

Поступающие в ИИ и используемые в нем данные (и доступ к ним) должны быть всегда защищены. Чтобы достичь этого, безопасность должна быть обеспечена на нескольких уровнях, и это потребует технических обсуждений и принятия решений.

Прежде всего, это безопасность данных. Многое из этого уже обсуждалось в разделе «Качество данных», и в этом процессе будет задействовано большинство команд ИТ-департамента.

Во-вторых, это полномочия доступа пользователей и мониторинг их действий. Кто и к чему получает доступ, и как вы будете отслеживать действия пользователей?

Пользователи могут определять собственные списки разрешений, а ИТ-отдел может их внедрять, но когда дело доходит до мониторинга действий пользователей, возникают сложности. Если, например, действия пользователей происходят только в локальных хранилищах данных, можно использовать такую технологию, как IAM (управление идентификацией и доступом), которая дает ИТ-отделу подробную информацию о каждом действии пользователя. Однако если речь идет об облачном доступе, IAM не сможет отслеживать эту активность на любом уровне детализации. Возможно, придется использовать ПО CIEM (управление правами доступа в облачной инфраструктуре), чтобы обеспечить детальную наблюдаемость действий пользователей в облаке. Кроме того, существуют «зонтичные» технологии, такие как IGA (управлением идентификацией и ее администрированием), которые могут служить всеобъемлющей основой для IAM и CIEM.

Группа ИТ-безопасности (и CIO) должны решить, какую стратегию принять для комплексной защиты ИИ.

Наконец, существуют угрозы, связанные с вредоносным ПО, которые уникальны для ИИ. Да, вы можете использовать стандартные средства обнаружения вредоносных программ для защиты от атак злоумышленников на данные ИИ, как и на обычные данные и приложения, но дальше сюжет закручивается. Например, в системы ИИ внедряются вредоносные программы, которые могут вводить неточные данные или изменять метки и характеристики данных. Это искажает результаты, полученные на основе этих данных, и приводит к ошибочным рекомендациям и решениям. Такая практика известна как «отравление данных».

Ожидается, что ИТ-специалисты разработают технику проверки входящих данных, которая сможет обнаружить возможные попытки отравления и пресечь их. Для этого могут использоваться технологии санации данных или проверки источников данных, и не исключено, что внедрение этих технологий может замедлить транспортировку данных. Технический персонал должен взвесить эти варианты, а CIO должен принять участие в обсуждении.

Итог

Итог очевиден: CIO должны уметь вести диалог и участвовать в принятии решений на нескольких уровнях ИИ: стратегическом, операционном и техническом. Даже если в компаниях есть специальные группы в области науки о данных, как их члены, так и пользователи в конечном счете обратятся в ИТ-отдел, который все равно должен все реализовать.

CIO могут помочь как своим сотрудникам, так и своим компаниям, если они приобретут рабочие знания о том, как работает ИИ, в дополнение к пониманию стратегических и операционных аспектов ИИ — ведь компании, сотрудники и бизнес-партнеры должны слышать голос CIO.