- Microsoft выпустила MAI-Image-1, свою первую собственную модель преобразования текста в изображение.
- Модель ориентирована на скорость, фотореализм и гибкость и стремится избежать повторяющихся визуальных образов.
- MAI-Image-I скоро будет доступен для Copilot и Bing.
Microsoft только что представила MAI-Image-1, свой первый собственный генератор текста в изображение. Разрабатывая модель внутри компании, Microsoft делает новое заявление, конкурируя не только с тяжеловесами отрасли, такими как Nano Banana и Midjourney от Google, но и со своим очень близким партнером, собственной линейкой моделей изображений искусственного интеллекта OpenAI.
MAI-Image-1 уже вошел в десятку лучших в таблице лидеров LMArena, публичной платформы для сравнительного анализа, где в настоящее время он доступен только там. Однако ситуация скоро изменится, поскольку Microsoft заявляет, что эта модель скоро будет внедрена в Copilot и Bing Image Creator.
Microsoft особенно гордится фотореалистичными производственными качествами MAI-Image-1, а также управляемым освещением и текстурами. Идея компании заключалась в том, чтобы предложить изображения ИИ, которые не похожи на изображения других моделей, тем самым выделяясь из привычной эстетики, знакомой каждому, кто видел много изображений ИИ, особенно популярной в социальных сетях «отстойной» формы.
Ключевым моментом была обработка обучающих данных и работа с профессиональными креативщиками над настройкой модели и тестированием ее использования обычным человеком. Microsoft надеется, что MAI сделает модели среднего пути или стабильного распространения сравнительно непредсказуемыми и медленными.
Собственные изображения искусственного интеллекта Microsoft
Microsoft вложила значительные средства во внедрение ИИ во все свои продукты, но в основном это затронуло инструменты OpenAI.
Однако с этого момента ситуация меняется. MAI-Image-1 теперь дополняет самостоятельно разработанные речевые и языковые модели MAI-1 и MAI-Voice-1. MAI-Image-1 — следующая часть головоломки.
Конечно, обычный человек ничего этого не заметит. Вам просто либо понравится, либо будет раздражать изображение, которое искусственный интеллект Microsoft PowerPoint создает при создании презентации. Компания заявляет, что ее ориентация на реализм и полезность означает, что люди будут очень счастливы. Будет меньше мечтательных пятен и больше изображений, которые действительно работают в документах, рекламе и презентациях.
Потому что вопрос не в том, «У кого есть имиджевая модель?» Вопрос в том, «У кого есть полезное устройство, которое люди действительно используют в реальных инструментах?» Именно здесь Microsoft делает ставку на то, что MAI-Image-1 проявит себя с лучшей стороны.
Для творческих профессионалов это может означать более быстрый путь от шаблона к готовой концепции. Для обычных пользователей это означает меньше неприятных разрывов между идеей и реализацией. А для Microsoft, если пользователям нравится эта модель, она делает всю экосистему AI Copilot более привлекательной. Если это не сработает, возможно, придется снова обратиться за помощью к OpenAI.
Однако на данный момент кажется, что эра Microsoft, опиравшаяся на OpenAI, закончилась. Будущее инструментов ИИ будет зависеть от того, кто их создает и где они появляются, а также от того, что они на самом деле могут делать и какие проблемы решают. Microsoft заявляет, что с помощью MAI-Image-1 она сама хочет ответить на все эти вопросы.
Следите за TechRadar в Новостях Google. И Добавьте нас в качестве предпочтительного источника чтобы получать новости, обзоры и мнения наших экспертов в своих лентах. Обязательно нажмите кнопку «Подписаться»!
И ты, конечно, тоже можешь Следите за TechRadar в TikTok за новостями, обзорами, распаковками в видео-форме и получайте от нас регулярные обновления WhatsApp к.