OpenAI U-Turn: не обучайте GPT-4 с данными клиентов API • Продвижение Web 2.0

Заметно отходя от своей предыдущей практики, OpenAI объявил, что больше не будет использовать данные клиентов, отправленные через его API, для обучения своих многофункциональных языковых моделей, таких как GPT-4.

Изменение было недавно подтверждено Сэмом Альтманом, генеральным директором OpenAI. интервью с CNBC.

Содержание

1 Новый подход OpenAI к пользовательским данным
2 Влияние на бизнес-клиентов
3 Более широкое влияние на отрасль
4 Эволюция ChatGPT: от GPT-3 до GPT-4
5 я в предвкушении

Новый подход OpenAI к пользовательским данным

Изменение политики OpenAI было реализовано 1 марта 2023 года, когда компания незаметно обновила свои Условия обслуживания, чтобы отразить это новое обязательство по защите конфиденциальности пользователей.

Альтман пояснил: «Клиенты явно не хотят, чтобы мы обучались на их данных, поэтому мы изменили наши планы: мы не будем этого делать».

API или интерфейсы прикладного программирования — это технологические рамки, которые позволяют клиентам напрямую подключаться к программному обеспечению OpenAI.

Альтман объяснил, что OpenAI не использовал данные API для обучения модели «какое-то время», предполагая, что это официальное объявление формализует существующую практику.

Влияние на бизнес-клиентов

Шаг OpenAI имеет далеко идущие последствия, особенно для его бизнес-клиентов, среди которых такие гиганты, как Microsoft, Salesforce и Snapchat.

Эти компании с большей вероятностью будут использовать возможности API OpenAI для выполнения своих операций, поэтому изменение конфиденциальности особенно актуально для них.

Однако новые меры защиты данных распространяются только на клиентов, использующих API-сервисы компании. В обновленных Условиях обслуживания OpenAI говорится: «Мы можем использовать контент из служб, отличных от нашего API».

Следовательно, другие формы ввода данных, такие как текст, введенный в популярный чат-бот ChatGPT, все еще могут использоваться OpenAI, если только данные не передаются через API.

ЧИТАТЬ Познакомьтесь с молодыми канадскими новаторами из программы Google Code Next.

Более широкое влияние на отрасль

Изменение политики OpenAI происходит по мере того, как отрасль сталкивается с потенциальным влиянием больших языковых моделей, таких как ChatGPT OpenAI, заменяющих традиционный материал, созданный руками человека.

Например, Гильдия писателей Америки недавно объявила забастовку после провала переговоров между гильдией и киностудиями. Гильдия выступала за ограничение использования ChatGPT OpenAI для создания или перезаписи сценариев.

Решение OpenAI не использовать данные клиентов для обучения знаменует собой поворотный момент в продолжающемся разговоре о конфиденциальности и искусственном интеллекте. Поскольку компании продолжают исследовать и расширять границы технологий искусственного интеллекта, обеспечение конфиденциальности пользователей и поддержание доверия, вероятно, будут по-прежнему находиться в центре этих дискуссий.

Эволюция ChatGPT: от GPT-3 до GPT-4

Важно отметить, что обязательство OpenAI не использовать данные клиентов для обучения относится к его последней языковой модели GPT-4, выпущенной 14 марта 2023 года.

GPT-4 представил несколько улучшений по сравнению со своим предшественником GPT-3, включая значительное увеличение ограничения на количество слов (25 000 по сравнению с ограничением в 3000 слов в ChatGPT), больший размер окна контекста, а также улучшенные навыки рассуждения и понимания.

Еще одной примечательной особенностью GPT-4 является его мультимодальность, или способность понимать и извлекать информацию из изображений в дополнение к тексту. Эта последняя модель генерирует текст, более похожий на человеческий, и использует такие функции, как смайлики, для более личного восприятия.

Однако точный размер и архитектура GPT-4 остаются в секрете, что приводит к предположениям о деталях модели.

Несмотря на эти слухи, генеральный директор OpenAI опроверг конкретные утверждения о размере модели.

По производительности GPT-4 имеет продемонстрировал сильные стороны в генерации текста, но и некоторые ограничения. Например, он набрал 54-й процентиль на экзамене Graduate Record Examination (GRE) Writing и от 43-го до 59-го процентиля на экзамене AP Calculus BC.

ЧИТАТЬ По данным источников, материнская компания TikTok ByteDance оценивается в 300 миллиардов долларов.

Кроме того, он хорошо справлялся с простыми задачами кодирования Leetcode, но его производительность снижалась по мере увеличения сложности задачи.

Хотя подробности процесса обучения GPT-4 официально не задокументированы, модели GPT в целом, как известно, включают крупномасштабное машинное обучение с различными интернет-текстами.

я в предвкушении

Из-за изменений в политике использования данных OpenAI данные, используемые для обучения языковых моделей, не включают информацию, передаваемую через API, если только пользователи не дали явного согласия на предоставление ее для этой цели.

Поскольку эта технология улучшает нашу жизнь и играет все более важную роль, интересно, как компании реагируют на проблемы и реагируют на сохранение конфиденциальности данных и завоевание доверия людей.

Избранное изображение, созданное автором с помощью Midjourney.

Source