Взрыв генеративного искусственного интеллекта в последние годы не замедлился и в 2024 году. Существует множество новых продуктов, использующих большие языковые модели, а новые функции или инструменты для существующих сервисов появляются почти каждый день.
ChatGPT более мощный и скоро получит новый голосовой режим, Google Gemini появляется повсюду, от Gmail до Google Drive, и даже Apple наконец-то совершила прыжок в сферу искусственного интеллекта (или Apple Intelligence).
Кроме того, есть стартапы от Suno до Rabbit, которые находят инновационные способы использования моделей ИИ — как своих собственных, так и моделей крупных игроков рынка. И многие другие ожидаются до конца года.
Поскольку мы находимся ровно в середине 2024 года, мы выбрали некоторые из самых впечатляющих, заметных и, возможно, печально известных релизов ИИ за этот год, чтобы вы могли поиграть с ними сегодня. Мы также выбрали несколько других инноваций в области искусственного интеллекта, которых еще нет на рынке, но которые должны появиться до конца года…
Содержание
ИИ в 2024 году: какие рыночные запуски в этом году были наиболее важными?
ChatGPT — это стандартный термин для волны генеративных продуктов искусственного интеллекта, использующих большие языковые модели. Однако OpenAI не полагается на это, чтобы оставаться впереди конкурентов, и в этом году продолжает регулярно расширять своего чат-бота с искусственным интеллектом и сопутствующие услуги.
В 2024 году ChatGPT получил функцию памяти, которая позволяет ему корректировать свое поведение на основе предыдущих взаимодействий, а также функцию чтения вслух, которая может превращать эти ответы в звуковое представление на 37 языках и пяти голосах. Настройка также является основной частью GPT Store, запущенного в январе, где пользователи могут создавать и использовать индивидуальные версии ChatGPT, ориентированные на конкретные задачи.
Менее обнадеживает то, что OpenAI вступила в публичный спор со Скарлетт Йоханссон из-за того, что голос Скай напоминал голос актрисы из фильма. Ееи с тех пор ему пришлось отложить запланированное обновление голосового режима до «осени». В июне в ChatGPT также произошли серьезные сбои.
В начале года Google Gemini просто называл семейство моделей, разработанных Google. Лишь в феврале Google отказался от бренда Bard, который использовал до этого, и перевел все свои проекты по генеративному искусственному интеллекту под эгидой Gemini.
Некоторые из этих новых и улучшенных функций, похоже, призваны догнать ChatGPT с помощью инструментов создания изображений (которые были ненадолго отключены из-за некоторых странных проблем с галлюцинациями) и Gems Store, который предлагает настраиваемых чат-ботов, таких как GPT Store.
В противном случае вы, вероятно, увидите Gemini в каждом другом продукте Google, который вы использовали за последние несколько месяцев — он помогает вам писать электронные письма, комментировать фотографии и действует как помощник на телефонах Android.
Rabbit R1 покорил выставку CES 2024 в январе, когда дебютировало карманное генеративное устройство искусственного интеллекта стоимостью 200 долларов, и компания завоевала признание, продемонстрировав, на что она способна с помощью миниатюрного сенсорного экрана, 360-градусной камеры и помощника на основе Perplexity. Большие языковые модели искусственного интеллекта для ответов в режиме реального времени. Поскольку ежемесячная абонентская плата отсутствует, она кажется более доступной, а продажи огромны.
Однако реальность Rabbit R1, включая нестабильное время автономной работы, иногда низкую производительность и все еще ограниченный набор функций среди других недостатков, делает его скорее предостережением для будущего оборудования, хотя он по-прежнему важен и, возможно, его стоит купить правильно. пользователь .
Как и Rabbit R1, Humane AI Pin — это носимое устройство, которое привлекло много внимания на выставке CES 2024. Постоянно включенный генеративный помощник на базе искусственного интеллекта прикрепляется к вашей одежде и обещает предоставлять информацию в режиме реального времени с помощью голосовых команд, а также записывать и анализировать ваши взаимодействия и встречи в течение дня.
Похоже, что, учитывая возможность постоянного прослушивания, возникло множество неотложных проблем с конфиденциальностью, не говоря уже о проблемах с надежностью распознавания речи в шумной обстановке. Несмотря на эти недостатки, он также быстро продался, но, как сообщается, сейчас Humane ищет покупателя.
Одной из самых громких историй об искусственном интеллекте в этом году может стать создание искусственных музыкальных генераторов, таких как Suno и Udio. Не только потому, что оба обладают впечатляющей способностью создавать сносную мелодию — дополненную текстами, вокалом и инструментами — из простого ввода текста, но также и потому, что Ассоциация звукозаписывающей индустрии Америки (RIAA) теперь предъявляет иск обоим за нарушение авторских прав.
Этот иск может иметь серьезные последствия как для музыкальных генераторов ИИ, так и для генеративного ИИ в целом. Между правообладателями и стартапами, обучающими новым инструментам искусственного интеллекта на огромных объемах данных, назревает буря — и будет интересно посмотреть, чем закончится эта юридическая тяжба. Это могло бы ускорить создание нормативной базы и сопутствующих законов, но до тех пор Suno и Udio могут продолжать создавать музыку, генерируемую искусственным интеллектом — пока.
ИИ в 2024 году: какие новинки рынка мы ожидаем в оставшуюся часть года?
Apple Intelligence, безусловно, является самым ожидаемым набором функций искусственного интеллекта до конца года. На мероприятии Apple WWDC 2024 было показано, что эта система «персонального интеллекта» будет доступна на iOS 18, iPadOS 18 и macOS Sequoia. Объединив собственные модели Apple с ChatGPT и другими платформами искусственного интеллекта (с вашего согласия), Apple Intelligence расширит возможности Siri как помощника, обеспечив лучшее руководство и понимание контекста.
Это связано с распознаванием экрана, что позволяет выполнять действия, связанные с информацией на экране, например: Б. добавление адреса из сообщений в карточку контакта и сотни других действий. Тот же искусственный интеллект помогает вам писать электронные письма и сообщения, обобщать аудиофайлы, а также создавать и редактировать изображения с помощью функции Image Playground. Вы даже можете создавать свои собственные смайлы, используя функцию Genmoji.
Чтобы использовать его, когда он выйдет позже в 2024 году в США, вам понадобится iPad или Mac серии M, либо iPhone 15 Pro или 15 Pro Max или новее, а это значит, что вам может потребоваться обновление.
Amazon занимается генеративным искусственным интеллектом на корпоративной стороне, но у Alexa, которая долгое время была синонимом голосовых помощников с искусственным интеллектом, были только фрагменты обновлений искусственного интеллекта, связанных с ChatGPT и другими. В этом году ситуация может измениться, но это может стоить вам дополнительных затрат.
Ходят слухи, что в этом году появится нечто под названием Remarkable Alexa. Он может включать в себя возможности генеративного искусственного интеллекта, выполнять несколько задач с помощью одной команды и даже размещать заказы на еду.
Перспективы
Генеративный искусственный интеллект все еще остается развивающейся областью, особенно когда речь идет о продуктах, ориентированных на потребителя. В следующем году коммерческая экосистема может стать более зрелой, но сейчас гонка идет за новыми функциями среди более крупных компаний, в то время как другие исследуют новые способы использования доступных моделей. Это означает подписку на программное обеспечение и сомнительное оборудование – по крайней мере, на данный момент.