Это продвинутая модель с комплексным функционалом по работе с изображениями.

После нескольких месяцев экспериментов с версией ChatGPT-4 в Интернете появился документ, описывающий возможности новой модели Vision. Ранее разработчики упоминали о возможности использования инструмента в медицинской и страховой сферах, например, для декодирования рентгеновских изображений. В документе представлены новые подробности о возможностях Vision:

  • Распознавать текст, формулы и таблицы на фотографиях;

  • Транскрипция медицинских документов, например, результатов компьютерной томографии;

  • подсчет количества объектов на изображении (функция несовершенна);

  • решение головоломок и оптических иллюзий;

  • Определение различий между изображениями, выявление ошибок и неточностей;

  • Различать человеческие эмоции.

Зрение может определить степень ущерба в результате аварии на основе изображений. Нейронная сеть дает подробные объяснения дефектов, но пока не способна рассчитать примерный ущерб.

Узнайте больше о возможностях Vision на сайте Справочный документ на английском.

Source

ЧИТАТЬ  Киты перевели 3 миллиона токенов Arbitrum (ARB) на Binance и Borroe. Финансовые показатели выросли на 25%