Подписчики X (ранее Twitter) Premium теперь могут попросить помощника Grok AI описывать изображения, а не просто создавать их. Компания xAI, принадлежащая Илону Маску, представила новую функцию визуального анализа контента, которая позволяет описывать фотографии, диаграммы и другие снимки с помощью Грок-2 Модель ИИ, которая обеспечивает работу чат-бота ИИ и создание изображений Flux AI.
Эта функция ставит Grok в один ряд с ChatGPT, Gemini и другими конкурентами. Если вы подписаны на планы подписки X, вы можете опробовать их прямо сейчас, нажав кнопку в графическом сообщении в
Параллельно с новой функцией Грок представил новый тест под названием RealWorldQA, целью которого является показать, насколько хорошо модель может описывать изображение реального мира, включая пространство между объектами. Компания утверждает, что RealWorldQA показывает, что Grok так же хорошо или лучше, чем его конкуренты, объясняет изображения, хотя он все еще находится в разработке. Ниже приведен пример того, как это работает: разделенный на X Илона Маска.
Грок теперь понимает образы и даже объясняет смысл шутки. Это ранняя версия. Оно быстро улучшится. https://t.co/gQ5BBISVRc28 октября 2024 г.
Смотри и Грок
Как видно на скриншоте, Грок способен разбить сложное многоуровневое изображение и объяснить, что в нем происходит. Затем он может экстраполировать юмор шутки, хотя, как почти всегда, объяснение шутки делает ее гораздо менее смешной. Тем не менее, это признак того, что xAI еще не закончил предоставлять Grok новые функции, особенно мультимодальные инструменты. Это может стать шагом к тому, чтобы Grok мог объяснять аудио- и видеоконтент так же, как он объясняет визуальный контент.
Не упомянут один элемент: как визуальный анализ Грока может отражать создание либеральных изображений чат-ботом с искусственным интеллектом, который, похоже, практически не заботится о вопросах авторских прав. Пользователям, сфотографировавшим Марио, пришлось с этим бороться, поскольку Трейсер, охотница за нарушителями авторских прав из Nintendo, преследовала их за нарушение авторских прав. Было бы интересно узнать, будет ли изображение Марио, созданное искусственным интеллектом, или любая другая интеллектуальная собственность описываться как таковая или в более общих терминах.
Поскольку xAI является владельцем xAI, очевидно, что эта функция есть и в других технологических компаниях, принадлежащих Маску. Полуавтономное вождение Tesla, безусловно, выиграет от возможности идентифицировать близлежащих людей и объекты, а также их расстояния. То же самое касается давно обещанных роботов-гуманоидов, которых Тесла разрабатывает в последние годы.