Недавно Пол Грэм заметил, что получает несколько холодных писем. Одно слово бросилось в глаза: вникать в. Он провел небольшой поиск и заметил, что использование этого термина резко возросло, по совпадению, когда инструменты GenAI захватили индустрию написания контента для электронной почты.

Я тоже это заметил. Почти каждая работа, которую я вижу, начинается со вступления, например В сегодняшнюю цифровую эпоху… Я стараюсь тщательно проверять эти статьи, чтобы убедиться в отсутствии дополнительных ошибок или неточностей, прежде чем публиковать их. Обычно они есть, и я их отвергаю.

Как ИИ определяет контент GenAI

По мере того, как языковые модели искусственного интеллекта (ИИ) становятся более сложными, они получают возможность создавать текст, чрезвычайно похожий на человеческий. Продвинутые модели, такие как ChatGPT, могут писать статьи, рассказы и даже компьютерный код, которые сложно отличить от других. сделанный человеком содержание. Это привело к гонке вооружений между генераторами контента ИИ и алгоритмами обнаружения. машина создана текст.

У Google, кажется, есть обновили свои последние алгоритмы для борьбы с контентом, созданным ИИ, даже несмотря на то, что он заявил, что это не нарушает условия обслуживания. Я думаю, их больше всего беспокоит автоматическое создание ферм контента, написанных искусственным интеллектом, в попытке злонамеренно украсть поисковый трафик.

Детекторы искусственного интеллекта используют различные методы для идентификации контента, созданного с помощью языковых шаблонов. К ним относятся статистический анализ лингвистических характеристик, таких как частота слов, длина предложения и образцы частей речи, а также модели машинного обучения, обученные на наборах текстовых данных, созданных человеком и искусственным интеллектом.

Стилометрический анализ а проверка фактов по базам знаний также может помочь выявить несоответствия, которые позволяют предположить, что текст мог быть сгенерирован машиной.

ЧИТАТЬ  Как работать с редакторами Википедии для обновления контента | Институт контент-маркетинга

Стилометрический анализ

Стилометрика — это исследование лингвистического стиля, обычно с целью идентификации автора текста на основе уникальных моделей и привычек письма. Это форма текстового анализа, основанная на том принципе, что у каждого человека есть уникальный способ использования языка – тип лингвистический отпечаток— это можно измерить количественно и использовать для атрибуции. Стилометрические методы включают в себя анализ различных особенностей текста, таких как:

  • Частота слов и богатство словарного запаса
  • Средняя длина предложения и слова
  • Употребление служебных слов (артикли, предлоги, местоимения и т. д.)
  • Знаки препинания и другие символы, не являющиеся словами.
  • Грамматические и синтаксические модели
  • Особенности орфографии и форматирования.

Этот подход использовался в самых разных контекстах: от решения вопросов об авторстве исторических документов до установления автора электронных писем с угрозами в ходе уголовных расследований. Стилометрия подходит для таких разных писателей, как Шекспир, «Записки федералиста» и Дж.К. Роулинг (которая посредством стилометрического анализа была идентифицирована как автор криминального романа, опубликованного под псевдонимом).

Измеряя эти атрибуты и сравнивая их с известными образцами произведений разных авторов, стилометрический анализ часто позволяет определить вероятного создателя спорного, анонимного или сгенерированного искусственным интеллектом текста.

Интересно, что Пол Грэм получил некоторую критику за свое открытие. Оказывается, вникать в иметь довольно распространено в Нигерии, а использование онлайн-систем в Нигерии быстро выросло. Так это ИИ или нигерийский контент? Пусть дискуссия продолжается.

ИИ-детекторы

Конечно, по мере того, как детекторы станут более совершенными, то же самое произойдет и с моделями ИИ, которые они пытаются идентифицировать. Обучая более крупные и разнообразные наборы данных, уточняя конкретные области и внедряя более совершенные архитектуры и методы, языковые модели учатся генерировать текст, который более точно имитирует образцы человеческого письма. Вот некоторые из ключевых факторов, в которых ИИ превосходит детекторы:

ЧИТАТЬ  Условия обслуживания карты Озон: плюсы и минусы, как и где оформить

  • Маскирование статистических сигнатур: Модели можно научить избегать чрезмерного использования определенных слов или структур предложений, которые могут активировать алгоритмы обнаружения.
  • Имитирование отдельных стилей письма: Обучая конкретного человека письму, ИИ может генерировать текст, соответствующий его уникальному стилометрическому отпечатку.
  • Улучшение семантической связности: Более продвинутые модели лучше способны поддерживать логическую и повествовательную последовательность в сгенерированном тексте, что затрудняет идентификацию его как искусственного.
  • Введение преднамеренных пробелов: Добавление незначительных ошибок или вариаций, типичных для человеческого письма, может помочь тексту, созданному искусственным интеллектом, выглядеть более аутентичным.
  • Быстрая переподготовка и адаптация: По мере появления новых методов обнаружения модели ИИ можно быстро обновлять, чтобы обойти их.

Даже самым продвинутым алгоритмам становится все труднее проверять подлинность контента, созданного искусственным интеллектом. В некоторых случаях машинописный текст настолько убедителен, что может обмануть даже читателей.

Это имеет важные последствия, поскольку контент, созданный ИИ, распространяется в Интернете. Хотя во многих случаях использование этой технологии безвредно или полезно, ее также можно использовать для дезинформации, мошенничества или манипуляций. Когда злоумышленники могут генерировать фейковые новости, обзоры продуктов или посты в социальных сетях, выдавая себя за людей, становится труднее доверять тому, что мы читаем в Интернете.

В будущем обнаружение контента с помощью искусственного интеллекта, скорее всего, останется игрой в кошки-мышки. Алгоритмы должны постоянно развиваться и совершенствоваться, чтобы идти в ногу с растущей сложностью языковых моделей. В то же время ответственные специалисты в области ИИ должны сыграть свою роль в этической и прозрачной разработке этих мощных инструментов, обеспечивая защиту от неправильного использования.

В конечном счете, чтобы ориентироваться в этом новом ландшафте, где машины смогут писать, как люди, потребуются технологические решения, человеческое суждение и разумная политика. обойти gpt AI. Правильный баланс будет иметь решающее значение для поддержания доверия и целостности в нашей информационной экосистеме, которая все больше использует искусственный интеллект.

ЧИТАТЬ  Пользовательское преобразование без кода и 5 других новых обновлений Microsoft Ads

Source