Искусственный интеллект сталкивается с юридическими проблемами, связанными с использованием авторского контента без разрешения. Решить их помогут новые законы, централизованное лицензирование и справедливая компенсация авторам, пишет на портале InformationWeek Дэвид Бенигсон, генеральный директор компании Signal AI.

В январе, на фоне ликования, вызванного ярким дебютом генеративного ИИ на мировой арене, адвокат, представляющий интересы трио художников, пришел в здание суда Сан-Франциско, чтобы подать коллективный иск против компаний Stability AI и Midjourney, создателей чрезвычайно популярных ИИ-инструментов генерации произведений искусства Stable Diffusion и Midjourney. В иске, в котором также упоминается онлайновое художественное портфолио DeviantArt, утверждается, что ответчики использовали миллиарды изображений, защищенных авторским правом, для обучения своих моделей ИИ, не получив на это согласия создавших их художников. Потенциальный ущерб составляет миллиарды долларов.

В настоящее время дело проходит через судебную систему США, но один факт уже неоспорим: эти три художника — лишь верхушка айсберга. За прошедшие после подачи иска месяцы такие компании, как OpenAI и Google, получили иски от людей, подобных актрисе и сатирику Саре Сильверман, в связи с их практикой сбора данных. В связи с многочисленными исками по поводу авторских прав, направленными непосредственно на самый «горячий» сектор технологий, возникает старинный вопрос: какова ценность интеллектуальной собственности? И кто должен получать вознаграждение?

Честно говоря, интуитивно не очевидно, что речь должна идти именно об авторских правах. При первом знакомстве с таким инструментом, как ChatGPT, может показаться, что это взгляд в будущее — первый шаг к почти всезнающему компьютеру из «Звездного пути». Легко поддаться ощущению, что эти генеративные инструменты создают нечто оригинальное. Но если отбросить глянцевую оболочку ИИ, то можно обнаружить, что в основе таких продуктов, как ChatGPT и Google Bard, лежит не какая-то непостижимая смесь алгоритмической алхимии или научно-фантастических приемов, а огромный массив контента и знаний, созданных человеком.

Не заблуждайтесь: именно этот контент является топливом для стратосферного взлета генеративного ИИ. И пока что за это практически никому не платят. Это серьезная проблема. За исключением Shutterstock, ни одна крупная технологическая компания до сих пор не объявила о серьезных планах по компенсации создателям контента, используемого для обучения моделей ИИ. Это происходит не потому, что ИИ-компании не считают контент ценным. Сами технологические гиганты, неравнодушные к судьбе правообладателей, прямо запретили использовать созданный их сервисами генеративный контент для обучения конкурирующих моделей машинного обучения.

Очевидно, что такая ситуация является неприемлемой и уже скоро может привести к плачевным последствиям. Если суды решат, что генеративный ИИ не защищен доктриной добросовестного использования (что вполне вероятно), то все еще находящаяся в стадии становления индустрия может оказаться под угрозой практически безграничных убытков.

Тем временем такие платформы, как Reddit, начинают активно бороться с бесконтрольным сбором данных. Недавно компания объявила о резком повышении цен на API, что, к сожалению, привело к уничтожению богатой экосистемы сторонних приложений, таких как Apollo и BaconReader.

Подобные непредвиденные внешние эффекты будут только множиться, если не будут приняты жесткие меры по защите правообладателей. Государства могут сыграть важную роль в этом вопросе, приняв новые законодательства, чтобы привести законы об интеллектуальной собственности в соответствие с требованиями XXI века, и заменив устаревшие нормативные рамки, созданные за десятилетия до того, как кто-то мог предсказать появление генеративного ИИ. Они также могут стимулировать создание централизованных лицензионных органов, которые будет работать с национальными и международными правозащитными организациями, чтобы гарантировать, что художники, создатели контента и издатели получают справедливую компенсацию за использование их контента компаниями, использующими генеративный ИИ.

В условиях столь сильной волатильности и неопределенности вокруг ИИ технологические компании заинтересованы в активном создании системы компенсации, а не в пассивном ожидании, пока будут приняты соответствующие законы. Предпринимая значимые шаги по поддержке авторов и издателей, компании, работающие в сфере ИИ, могут продемонстрировать приверженность этическим нормам и укрепить свою корпоративную репутацию. Кроме того, они могут стать первопроходцами в создании новых моделей управления правами на интеллектуальную собственность, которые, в свою очередь, могут стимулировать будущие инновации. И самое главное, обеспечив справедливое вознаграждение, технологические компании поддержат динамично развивающуюся экономику контента, на которой строится их успех.

Последнее замечание является ключевым. В своем стремлении использовать безграничные возможности генеративного ИИ мы не должны забывать, что процветающая экосистема контента, в частности успешная индустрия новостей, является основой, на которой базируются такие крупные языковые модели, как ChatGPT. Компании, занимающиеся разработкой ИИ, в том числе та, которую я возглавляю, несут ответственность перед новостными партнерами и создателями контента за защиту их интеллектуальной собственности и за предоставление им возможности честно и безопасно ее монетизировать. Это не просто правильное решение, это то, как мы можем обеспечить надежный пользовательский опыт без галлюцинаций.

Можно смотреть на грядущую расплату за интеллектуальную собственность как на надвигающийся кризис, но с тем же успехом мы можем рассматривать ее как возможность, открывающуюся раз в несколько поколений. Вполне вероятно, что мы стоим на пороге величайшего потрясения человеческой цивилизации со времен промышленной революции. Давайте не будем бояться представить себе будущее, в котором будут процветать и люди, и искусственный интеллект.