Управление по авторским правам Соединенных Штатов выпустило предварительную публикацию отчета об использовании защищенных авторским правом материалов для обучения генеративного искусственного интеллекта, в котором изложены юридические и фактические случаи, который определяет риски авторских прав на каждом этапе развития генеративного искусственного интеллекта.

Отчет был создан в ответ на общественное и конгрессское беспокойство по поводу использования контента, защищенного авторским правом, включая пиратские версии, с помощью систем искусственного интеллекта без сначала получения разрешения. Хотя офис об авторском праве не принимает юридических решений, отчеты, которые он создает, предлагают юридические и технические руководства, которые могут повлиять на законодательство и судебные решения.

В отчете предлагается четыре причины, по которым компании по технологиям ИИ должны быть обеспокоены:

  1. В отчете говорится, что многие акты сбора данных, процесс создания наборов данных из работы, защищенных авторским правом и обучения, могут «представлять собой prima facie нарушение».
  2. Это бросает вызов общей обороне отрасли, что обучающие модели не включают «копирование», отмечая, что процесс создания наборов данных включает в себя создание нескольких копий, и что улучшения в весах модели также могут содержать копии этих работ. В отчете приводятся сообщения о случаях, когда ИИ воспроизводит авторские права, либо слово для слова, либо «почти идентичные» копии.
  3. В нем говорится, что учебный процесс подразумевает право на размножение, одно из исключительных прав, предоставленных на то, чтобы подчеркнуть, что запоминание и регургитация контента, защищенного авторским правом, могут представлять собой нарушение, даже если он непреднамерен.
  4. Трансформационное использование, где оно добавляет новое значение к оригинальной работе, является важным соображением в анализе честного использования. В отчете признается, что «некоторые использование защищенных авторских прав в обучении ИИ, вероятно, будут преобразующими», но «не согласны» с аргументом, что обучение искусственного интеллекта преобразует просто потому, что он напоминает «человеческое обучение», например, когда человек читает книгу и учится на ней.
ЧИТАТЬ  Самые милые животные в мире: 15 самых очаровательных животных

Последствия авторских прав на каждом этапе развития ИИ

Возможно, самая чертовски часть отчета — это то, где в нем говорится, что на каждом этапе развития ИИ могут возникнуть проблемы с авторским правом и перечисляет каждый этап развития и то, что с ним может быть не так.

«А. Сбор и курирование данных

Шаги, необходимые для создания учебного набора данных, содержащего авторские права, явно подразумевают право воспроизведения …

Б. Обучение

Процесс обучения также подразумевает право на размножение. Во-первых, скорость и масштабы обучения требуют, чтобы разработчики загружали набор данных и копировали его в высокопроизводительное хранилище до обучения.

Эти копии могут сохраняться достаточно долго, чтобы нарушить право на воспроизведение, 160 в зависимости от рассматриваемой модели и конкретных аппаратных и программных реализаций, используемых разработчиками.

В -третьих, процесс обучения — предоставление примеров обучения, измерение производительности модели в отношении ожидаемых результатов и итеративно обновлять веса для повышения производительности — могут привести к весам модели, которые содержат копии работ в учебных данных. Если это так, то последующее копирование весов модели, даже из -за партий, не участвующих в процессе обучения, также может представлять собой нарушение prima facie.

C. тряпка

RAG также включает в себя воспроизведение авторских прав. 110 Обычно Rag работает одним из двух способов. В одном, разработчик ИИ копирует материал в базу данных поиска, и генеративная система ИИ может позже получить доступ к этой базе данных, чтобы извлечь соответствующий материал и предоставить его модели вместе с подсказкой пользователя.111 В другом система извлекает материал из внешнего источника (например, поисковая система или конкретный веб -сайт).

D. Выходы

Генеративные модели искусственного интеллекта иногда выводят материал, который повторяет или очень напоминает авторские права. Пользователи продемонстрировали, что генеративный ИИ может создавать почти точные копии неподвижных изображений из фильмов, 112 авторских персонажей, 113 или текста из новостей.

В отчете обнаруживаются риски нарушения на каждом этапе развития генеративного ИИ, и, хотя его выводы не являются юридически обязательными, их можно использовать для создания законодательства и служить руководством для судов.

ЧИТАТЬ  Все, что появится на Disney+ в июне 2023 года | цифровые тренды

Вынос

  • Обучение ИИ и нарушение авторских прав:
    В докладе утверждается, что как получение данных, так и модельное обучение могут включать несанкционированное копирование, возможно, составляющее «нарушение prima facie».
  • Отказ от обороны промышленности:
    Офис авторского права оспаривает общую отрасль ИИ, что обучение не связано с копированием и что обучение искусственного интеллекта аналогично обучению человека.
  • Справедливое использование и трансформационное использование:
    Отчет не согласен с широким применением трансформационного использования в качестве защиты, особенно если это основываться на сравнении с человеческим познанием.
  • Забота обо всех этапах развития искусственного интеллекта:
    Проблемы с авторским правом выявляются на каждом этапе разработки ИИ, из сбора данных, обучения, поиска-аугированного поколения (RAG) и выходов моделей.
  • Запоминание и вес модели:
    Офис предупреждает, что модели ИИ могут сохранять защищенное авторским правом контент в весах, что означает, что даже использование или распределение этих весов может нарушать.
  • Выходное воспроизведение и производные работы:
    Способность ИИ генерировать почти идентичные результаты (например, фильмы, кадры, персонажи или статьи) вызывает обеспокоенность по поводу нарушений как размножения, так и в производных правах на работу.
  • RAG-специфический риск нарушения:
    Оба метода тряпки, копирование контента в базу данных или извлечение из внешних источников описываются как включающие потенциально нарушающие размножения.

В отчете Управления по авторским правам в США описывается множество способов, которыми генеративная разработка искусственного интеллекта может нарушать закон об авторском праве, оспаривая законность использования защищенных авторских прав без разрешения на каждом техническом этапе, от создания наборов данных до моделей выходов. Он отвергает использование аналогии с человеческим обучением в качестве защиты и широкого применения в отрасли справедливого использования. Хотя отчет не имеет такой же силы, как судебный вывод, отчет может использоваться в качестве руководства для законодателей и судов.

ЧИТАТЬ  Требования к поступающим в UNIABUJA 2024/2025: UTME и прямой вход

Показанное изображение от Shutterstock/Treecha



Source link