На этой неделе Reddit объявил об обновленных условиях использования инструментов и сервисов для разработчиков, платного доступа к Reddit Data API и дополнительных собственных инструментов модерации.
В то время как блог Reddit объяснил изменения как часть создания здоровой экосистемы, New York Times сообщил что платный доступ к API не позволит крупным компаниям использовать контент Reddit для бесплатного обучения больших языковых моделей (LLM).
Обновлено документация подтверждает, что разработчики могут использовать контент Reddit для обучения LLM только с предварительного одобрения Reddit и что это представляет собой коммерческий доступ.
Бард не может подтвердить, включил ли Google контент Reddit в свои обучающие данные как часть общедоступных наборов данных, «вероятно используемых».
ChatGPT не может делиться определенным списком источников, но Reddit может быть одним из них.
Bing AI подтверждает, что Microsoft использует несколько источников данных, включая индекс и алгоритм Bing с моделями OpenAI GPT.
Учитывая, что ChatGPT, возможно, использовал данные Reddit, можно предположить, что Microsoft тоже может использовать их благодаря партнерству с OpenAI.
Сколько будет доступа к API данных Reddit?
Согласно обновленному разработчику условия — с 19 июня 2023 г. — Reddit будет взимать плату за то, что он считает коммерческим доступом и использованием API:
- Если монетизируемый бизнес или услуга подключаются к API, это считается коммерческим доступом.
- Если бизнес или услуга прямо или косвенно приносит доход от любых данных Reddit или производных данных.
Ниже приведены конкретные примеры монетизируемых сервисов платформы разработчиков Reddit. страница:
- Сервисы, приносящие доход от рекламы и платного доступа.
- Поисковые системы, которые зарабатывают на рекламе.
- Сервисы, которые взимают плату с пользователей за доступ к исследованиям или данным.
- Услуги, за которые пользователи платят абонентскую плату.
- Услуги, включенные в дополнительные продажи другого продукта.
- Сервисы, которые публикуют контент Reddit на монетизируемых веб-сайтах и в приложениях.
- Сервисы, использующие данные Reddit для обучения моделей.
Исследователи, которые используют API в некоммерческих целях, могут продолжать это делать, если они соглашаются не публиковать конфиденциальные данные Reddit или продукты, созданные с использованием контента Reddit. За доступ к большим объемам данных может взиматься плата для покрытия расходов, связанных с массовым доступом к API.
Кристофер Слоу, технический директор Reddit, прокомментировал в обсуждении новостей в сабреддите машинного обучения, написав:
«Мы в восторге от исследований LLM и ML и в целом очень гордимся той ролью, которую Reddit играл в этой работе на протяжении многих лет. Таким образом, хотя нам нужно сделать больше, чтобы обеспечить ответственный обмен данными наших пользователей, мы не стремимся препятствовать академическим исследованиям или зарабатывать деньги на исследователях».
Разработчики также должны признать, что пользовательский контент на Reddit принадлежит пользователям и подчиняется указанным пользователем правам и ограничениям использования. Пользователь соглашение подтверждает, что пользователи сохраняют за собой права на свой контент, но также предоставляют Reddit бесплатную лицензию на его использование.
Reddit поделится информацией о ценах, как только они будут завершены.
Реддит заверенный модераторы, что изменения API не коснутся инструменты которые помогают обеспечить соблюдение правил субреддита и удалить контент, нарушающий политики Reddit.
Модераторам рекомендуется следить за Новости модов subreddit, чтобы быть в курсе последних разработок в области инструментов модерации. Реддит как сообщается стремится поддерживать более строгую модерацию сообщества, чтобы рекламодатели были довольны.
Будут ли Reddit Data API инструменты управления социальными сетями?
Если вы используете какой-либо сторонний инструмент для публикации в Reddit, поиска публикаций в Reddit или создания аналитических отчетов для своей учетной записи Reddit, это может повлиять на вас тремя способами.
- Вам может понадобиться больше доступа к функциям Reddit через некоторые сторонние сервисы.
- Возможно, вам придется начать платить за некоторые сторонние сервисы, которые когда-то предлагали бесплатные тарифные планы, чтобы компенсировать возросшую стоимость доступа к Reddit Data API.
- Возможно, вам придется платить больше, чем вы уже заплатили за некоторые сторонние услуги.
Мы увидим эффект, когда Reddit опубликует информацию о ценах на API. Платформы, которые интегрируются с Reddit, включают Zapier, HootSuite, IFTTT, Feedly, Социальный вид, Tray.ioи Социальный подъем. Эти платформы позволяют пользователям получать ценную информацию об участии Reddit.
Что касается того, какого роста вы можете ожидать, если ваш инструмент управления социальными сетями перенесет расходы на своих пользователей: для сторонних сервисов с более чем миллионом пользователей это может быть всего лишь дополнительный доллар в месяц на пользователя. Для сервисов с меньшим количеством пользователей это может быть намного больше.
Новости по теме: Как изменения в Twitter API нарушили работу популярных сервисов
Через две недели после того, как пользователи начали распространять изображения, подразумевающие корпоративные цены на Twitter API, Twitter официально обновил свой веб-сайт с тарифными планами для премиум-доступа к Twitter API v2.
Это позволяет разработчикам создавать приложения, которые извлекают и анализируют данные из Twitter, что позволяет этим инструментам искать твиты по определенной теме, обнаруживать влиятельных лиц и создавать аналитические отчеты об аудитории и вовлеченности учетной записи Twitter.
API также позволяет приложениям публиковать обновления в Twitter, что позволяет инструментам управления социальными сетями планировать и публиковать твиты в учетной записи.
Twitter предлагает три варианта ценообразования для API v2.
Twitter пригласил пользователей, которым нужно больше данных, подать заявку корпоративный API доступ через Гугл форма.
Корпоративные API-интерфейсы предлагают покрытие общедоступных твитов в режиме реального времени с помощью определенных операторов и правил, расширенную фильтрацию поиска, полный исторический доступ к архивным твитам и действиям в учетных записях определенных пользователей (твиты, ответы, подписки, лайки, блокировки и т. д.).
Twitter не указывает цены на доступ к Twitter API корпоративного уровня на своем веб-сайте. А Твитнуть разделяет Проводной предлагает диапазон цен от 42 000 до 210 000 долларов в месяц.
Вот документы. «Большой пакет» — 210 000 долларов в месяц или 2,5 миллиона долларов в год (подсказка @techmeme) pic.twitter.com/xuBiCBzoe7
— Крис Стокель-Уокер ~ @[email protected] (@stokel) 10 марта 2023 г.
По словам пользователей из частных сообществ разработчиков Twitter, которые связались с платформой для получения дополнительной информации, она не предлагает никаких планов между Basic (за 100 долларов в месяц) и Enterprise.
Твиттер также обесценился предыдущие версии API, включая уровни доступа Standard (v1.1), Essential (v2), Elevated (v2) и Premium API.
Повышение стоимости и устаревший доступ повлияли на следующие службы, которые полагались на Twitter API.
- Жизненно важные предупреждения о погоде от нескольких национальных метеорологических служб. Счета были ограничены.
- IFTTT, служба автоматизации с 18 миллионов пользователейстолкнулся с проблемы с изменениями API, внесенными в начале апреля.
- Feedly, служба чтения новостей, которая интегрировала функции ИИ в 2020 для более чем 18 миллионов пользователей, на пенсии Функции Твиттера и начал изучать возможности интеграции с Mastodon.
- Flipboard, служба агрегации новостей с 145 миллионов пользователейобъявил, что каналы Twitter останутся сломанный и что мастодонт будет в его будущем.
- HootSuite, инструмент управления социальными сетями с 18 миллионов пользователейперестал предлагать бесплатные планы пользователям, которые управляют Twitter и другими социальными профилями.
Мы связались с создателями нескольких популярных инструментов управления социальными сетями для получения комментариев. Пока они не давали комментариев, поскольку работают с Twitter над индивидуальными решениями.
Илон Маск, генеральный директор Twitter (Now X Corp), сказал, что платный доступ к API сократит злоупотребление ботами.
Он также предложил Microsoft отказ оплата сборов Twitter API может привести к иск над якобы «грабить базу данных Твиттера» и «продать нашу [Twitter] данные другим».
GitHub, Microsoft и OpenAI сталкиваются с коллективным иском иск в Сан-Франциско, штат Калифорния, за якобы использование предоставленного пользователями контента, нарушающего несколько правил лицензирования с открытым исходным кодом. МайкрософтGitHub и OpenAI просили отклонить иск.
Эта же фирма также подала коллективный иск иск против Stability AI, DeviantArt и Midjourney за использование Stable Diffusion, обвиняемых в использовании защищенных авторским правом рисунков в своих обучающих данных.
SEJ будет следить за развитием событий, как и другие компании с большими репозиториями общедоступных данных, и в будущем будут вести диалог в ответ на компании, использующие ИИ для обучения данных.
Избранное изображение: Деннис Диател/Shutterstock