Новое смелое видение Google будущего онлайн-поиска, основанное на технологии искусственного интеллекта, вызывает негативную реакцию во всей отрасли из-за опасений, что оно может нанести ущерб открытой экосистеме Интернета.
В центре разногласий находятся недавно запущенные Google «Обзоры искусственного интеллекта», которые представляют собой сводки, целью которых является прямой ответ на поисковые запросы путем сбора информации со всего Интернета.
Обзоры ИИ появляются на видном месте в верхней части страниц результатов, что потенциально ограничивает потребность пользователей переходить на веб-сайты издателей.
Этот шаг вызвал судебные иски во Франции, где издатели возбудили дела, обвинив Google в нарушении прав интеллектуальной собственности путем использования их контента для обучения моделей искусственного интеллекта без разрешения.
Группа французских издателей досрочно выиграла судебное разбирательство в апреле 2024 года. Судья обязал Google договориться о справедливой компенсации за повторное использование фрагментов их контента.
Издатели в США выдвигают аналогичные возражения, поскольку новые обзоры поиска Google с использованием искусственного интеллекта угрожают перекачать трафик из источников. Они утверждают, что Google несправедливо получает прибыль от чужого контента.
Дебаты подчеркивают необходимость обновленных рамок, регулирующих использование онлайн-данных в эпоху искусственного интеллекта.
Содержание
Опасения издателей
По мнению наблюдателей отрасли, последствия обзоров ИИ могут повлиять на миллионы независимых авторов, которые зависят от реферального трафика в Поиске Google.
Рассказывает Фрэнк Пайн, исполнительный редактор MediaNews Group. Вашингтон Пост:
«Если бы журналисты поступали так друг с другом, мы бы назвали это плагиатом».
Компания Пайна, издающая Denver Post и Boston Herald, входит в число тех, судиться OpenAI за якобы сбор статей, защищенных авторским правом, для обучения своих языковых моделей.
Модель дохода Google уже давно основана на привлечении трафика на другие веб-сайты и монетизации этого потока через платные рекламные каналы.
Обзоры ИИ грозят изменить эту модель доходов.
В статье цитируется Кимбер Мазерн, ведущая кулинарный блог:
«[Google’s] Цель – сделать так, чтобы людям было как можно проще найти нужную им информацию. Но если вы исключите людей, которые являются источником жизненной силы для создания этой информации, это окажет миру медвежью услугу».
Согласно отчету Post, Raptive, компания, предоставляющая рекламные услуги, оценивает, что изменения могут привести к потере доходов онлайн-создателей в 2 миллиарда долларов.
Они также полагают, что некоторые веб-сайты могут потерять две трети своего поискового трафика.
Генеральный директор Raptive Майкл Санчес рассказал The Post:
«То, что и без того не было равным игровым полем, может привести к тому, что открытый Интернет окажется под угрозой выживания».
Опасения профессионалов отрасли
Обзоры искусственного интеллекта Google по понятным причинам вызывают обеспокоенность среди профессионалов отрасли, о чем свидетельствуют многочисленные твиты, критикующие этот шаг.
Мэтт Гиббс задался вопросом, как Google разработал базу знаний для своего ИИ, прямо заявив: «Они украли ее у издателей, которые проделали реальную работу по созданию знаний. Google — кучка воров».
Из верхней части сегодняшней статьи Google «Генеративный ИИ в поиске».
Как они создали эту базу знаний?
Они обворовали издателей, которые проделали реальную работу по созданию знаний.
Гугл — кучка воров. pic.twitter.com/SIkPqtWZwa
— Мэтт Гиббс (@ematt) 14 мая 2024 г.
В своем твите Кристина Шахингер повторила аналогичные настроения, назвав ответы ИИ Google «полным механизмом цифровой кражи, который вообще не позволит сайтам получать клики».
.@sundarpichai и @Google запустить ответы ИИ на #GoogleIO2024 иначе известный как полноценный механизм цифровой кражи, который вообще не позволяет сайтам получать клики.
Нам нужно, чтобы правительство вмешалось сейчас и настояло на том, чтобы принести солнечный свет.
Это ОДИН ОТВЕТ ИИ.
Нажмите на него. pic.twitter.com/5NNtKAURxC— Кристина (@schachin в Threads) ?? (@schachin) 14 мая 2024 г.
Гарет Бойд ретвитнул цитату из статьи Washington Post, в которой рассказывается о трудностях блоггера Джейка Боли, чей сайт недавно увидел падение трафика Google на 96%.
Бойд сказал: «Прецедент, созданный OpenAI и Google, пугает…» и что «больше людей должны быть в равной степени злы» на обе компании за «открытую кражу контента».
Прецедент, созданный OpenAI и Google, пугает… больше людей должны быть в равной степени недовольны OpenAI и Google за открытую кражу контента.
Чтобы внести ясность: я НЕНАВИЖУ регулирование, но к тому времени, когда ИИ будет регулироваться вполне справедливо, будет уже слишком поздно.
— Гарет Бойд (@garethaboyd) 15 мая 2024 г.
В своем твите Аврам Пилч прямо обвинил Google в краже, заявив, что «данные, используемые для обучения их ИИ, поступили от тех самых издателей, которые позволили Google их сканировать, и теперь им будет нанесен ущерб. Это воровство, простое и понятное. И это угроза будущему Интернета».
Вы можете сказать, что Google ничего не «должен» издателям, но данные, используемые для обучения их ИИ, поступили от тех самых издателей, которые позволили Google их сканировать и теперь им будет нанесен ущерб. Это воровство, простое и понятное. И это угроза будущему Интернета.
— Аврам Пильч (@geekinchief) 15 мая 2024 г.
Лили Рэй сделала аналогичное заявление о Google: «Используя весь контент, взятый с сайтов, на которых создан Google. Практически без атрибуции и трафика».
Используя весь контент, который они взяли с сайтов, созданных Google. Практически без атрибуции и трафика.
— Лили Рэй ? (@lilyraynyc) 14 мая 2024 г.
Правовая серая зона
Этот спор перерастает в более широкие дебаты вокруг интеллектуальной собственности и добросовестного использования, поскольку системы искусственного интеллекта обучаются на беспрецедентных масштабах данных, собираемых через Интернет.
Google утверждает, что ее модели обрабатывают только общедоступные веб-данные и что издатели ранее получали выгоду от поискового трафика.
Издатели дают неявное согласие на индексацию их контента поисковыми системами, если они не откажутся от этого.
Однако законы не были задуманы с учетом обучения моделей ИИ.
Каков путь вперед?
Эти дебаты подчеркивают необходимость новых правил использования ИИ онлайн-данных.
Дальнейший путь неясен, но ставки высоки.
Некоторые предлагают разделение доходов или лицензионные сборы, когда контент издателя используется для обучения моделей ИИ. Другие предлагают систему подписки, которая дает владельцам веб-сайтов больше контроля над тем, как их контент используется для обучения ИИ.
Постановления Франции предполагают, что суды могут вмешаться без четких указаний и добросовестных переговоров.
Интернет всегда опирался на баланс между поисковыми системами и создателями контента. Если этот баланс будет нарушен без новых мер безопасности, это может подорвать обмен информацией, которая делает Интернет таким ценным.
Рекомендованное изображение: Вероникша/Shutterstock