Компания Cerebras, занимающаяся искусственным интеллектом из Силиконовой долины, выпустила семь моделей GPT с открытым исходным кодом, чтобы обеспечить альтернативу жестко контролируемым и проприетарным системам, доступным сегодня.

Бесплатные модели GPT с открытым исходным кодом, включая веса и рецепт обучения, были выпущены Cerebras, компанией Cerebras, базирующейся в Силиконовой долине, инфраструктурой искусственного интеллекта для приложений искусственного интеллекта под строго разрешительной лицензией Apache 2.0.

В определенной степени семь моделей GPT являются доказательством концепции суперкомпьютера Cerebras Andromeda AI.

Инфраструктура Cerebras позволяет их клиентам, таким как Jasper AI Copywriter, быстро обучать свои собственные языковые модели.

А Сообщение в блоге Cerebras об аппаратной технологии отметил:

«Мы обучили все модели Cerebras-GPT на 16-кратном кластере CS-2 Cerebras Wafer-Scale Cluster под названием Andromeda.

Кластер позволил быстро завершить все эксперименты без традиционного проектирования распределенных систем и параллельной настройки моделей, необходимых для кластеров графических процессоров.

Самое главное, это позволило нашим исследователям сосредоточиться на разработке машинного обучения, а не распределенной системы. Мы считаем, что возможность легко обучать большие модели является ключевым фактором для широкого сообщества, поэтому мы сделали кластер Cerebras Wafer-Scale доступным в облаке через Студия моделирования ИИ Cerebras».

Модели Cerebras GPT и прозрачность

Cerebras ссылается на то, что владение технологией искусственного интеллекта сосредоточено всего в нескольких компаниях, как на причину создания семи моделей GPT с открытым исходным кодом.

OpenAI, Meta и Deepmind держат большой объем информации о своих системах в секрете и строго контролируют, что ограничивает инновации тем, что три корпорации решают, что другие могут делать с их данными.

Является ли система с закрытым исходным кодом лучшей для инноваций в области ИИ? Или за открытым исходным кодом будущее?

ЧИТАТЬ  От учителя до владельца онлайн-школы: как создать личный бренд в жесткой и высококонкурентной нише

Cerebras пишет:

«Для того, чтобы LLM были открытой и доступной технологией, мы считаем важным иметь доступ к современным моделям, которые являются открытыми, воспроизводимыми и бесплатными как для исследовательских, так и для коммерческих приложений.

С этой целью мы обучили семейство моделей трансформаторов, используя новейшие методы и открытые наборы данных, которые мы называем Cerebras-GPT.

Эти модели являются первым семейством моделей GPT, обученных с использованием формулы Chinchilla и выпущенных по лицензии Apache 2.0».

Таким образом, эти семь моделей выпущены на обнимающее лицо и Гитхаб поощрять дополнительные исследования за счет открытого доступа к технологии искусственного интеллекта.

Эти модели были обучены с помощью суперкомпьютера Cerebras Andromeda AI, и на этот процесс ушло всего несколько недель.

Cerebras-GPT полностью открыт и прозрачен, в отличие от последних моделей GPT от OpenAI (GPT-4), Deepmind и Meta OPT.

OpenAI и Deepmind Chinchilla не предлагают лицензии на использование моделей. Meta OPT предлагает только некоммерческую лицензию.

OpenAI GPT-4 не имеет абсолютно никакой прозрачности в отношении своих обучающих данных. Использовали ли они данные Common Crawl? Они копались в Интернете и создавали свой собственный набор данных?

OpenAI держит эту информацию (и многое другое) в секрете, в отличие от полностью прозрачного подхода Cerebras-GPT.

Далее все открыто и прозрачно:

  • Архитектура модели
  • Тренировочные данные
  • Вес модели
  • Контрольно-пропускные пункты
  • Оптимальный для вычислений статус обучения (да)
  • Лицензия на использование: Лицензия Apache 2.0

Семь версий представлены моделями 111M, 256M, 590M, 1.3B, 2.7B, 6.7B и 13B.

Это было объявил:

«Впервые среди компаний, производящих оборудование для искусственного интеллекта, исследователи Cerebras обучили на суперкомпьютере Andromeda AI серию из семи моделей GPT с параметрами 111M, 256M, 590M, 1.3B, 2.7B, 6.7B и 13B.

Эта работа, обычно занимающая несколько месяцев, была завершена за несколько недель благодаря невероятной скорости систем Cerebras CS-2, входящих в состав Andromeda, и способности архитектуры потоковой передачи веса Cerebras устранить проблемы, связанные с распределенными вычислениями.

Эти результаты показывают, что сегодня системы Cerebras могут обучать самые большие и сложные рабочие нагрузки ИИ.

Это первый раз, когда обнародован набор моделей GPT, обученных с использованием самых современных методов повышения эффективности обучения.

Эти модели обучены с максимальной точностью для данного вычислительного бюджета (т.е. обучение эффективно с использованием рецепта Chinchilla), поэтому они имеют меньше времени обучения, более низкую стоимость обучения и потребляют меньше энергии, чем любые существующие общедоступные модели».

ИИ с открытым исходным кодом

Фонд Mozilla, создатель программного обеспечения с открытым исходным кодом Firefox, основал компанию под названием Mozilla.ai для создания систем GPT с открытым исходным кодом и рекомендательных систем, заслуживающих доверия и уважающих конфиденциальность.

ЧИТАТЬ  Автоматизация создания технического задания для писателя с помощью чата GPT и Google Таблиц.

Databricks также недавно выпустила клон GPT с открытым исходным кодом под названием Dolly, целью которого является демократизация «магии ChatGPT».

В дополнение к этим семи моделям Cerebras GPT другая компания под названием Nomic AI выпустила GPT4All, GPT с открытым исходным кодом, который может работать на ноутбуке.

Движение ИИ с открытым исходным кодом находится на начальной стадии, но набирает обороты.

Технология GPT приводит к масштабным изменениям в разных отраслях, и вполне возможно, а может быть, и неизбежно, что вклад в открытый исходный код может изменить облик отраслей, движущих этим изменением.

Если движение за открытый исходный код будет продолжать развиваться такими темпами, мы можем оказаться на пороге сдвига в инновациях ИИ, который не позволит им сконцентрироваться в руках нескольких корпораций.

Читайте официальное объявление:

Cerebras Systems выпускает семь новых моделей GPT, обученных на системах CS-2 вафельного масштаба

Избранное изображение Shutterstock/Меркушев Василий





Source link