Второй день 12 дней OpenAI OpenAI сместился в сторону менее впечатляющих и более предпринимательских интересов по сравнению с общим представлением модели OpenAI o1 на ChatGPT в первый день.

Вместо этого OpenAI объявила о планах выпустить Reinforcement Fine-Tuning (RFT) — способ настройки своих моделей ИИ для разработчиков, которые хотят адаптировать алгоритмы OpenAI для конкретных типов задач, особенно для более сложных. Этот выпуск знаменует собой явный сдвиг в сторону корпоративных приложений по сравнению с обновлениями, ориентированными на потребителя в первый день. Вы можете думать о RFT как о методе улучшения работы моделей ИИ путем обсуждения с ними ответов. Используя набор данных разработчика и критерии оценки, платформа OpenAI может обучать свой специализированный ИИ без необходимости значительного дорогостоящего подкрепления последующим опытом.



Source