Усовершенствованный аудиоулог и поколение с Gemini 2.5 • Продвижение Web 2.0

Безопасность и ответственность

Мы проактивно оценили потенциальные риски на каждом этапе процесса разработки для этих нативных аудио -функций, используя то, что мы научились для просвещения наших стратегий смягчения последствий. Мы проверяем эти меры благодаря строгим внутренним и внешним оценкам безопасности, включая полную красную команду для ответственного развертывания. Кроме того, все аудио выходные данные наших моделей интегрированы СинтетическийНаша технология Watermark для обеспечения прозрачности путем создания звука, сгенерированного идентифицируемым ИИ.

Нативные аудио способности для разработчиков

Мы предоставляем нативные аудиовыходы для моделей Gemini 2.5, предоставляя разработчикам новые возможности для создания более богатых и интерактивных приложений через API Gemini Google для изучения Или Vertex AiПолем

Чтобы начать исследовать, разработчики могут попробовать нативное звуковое диалоговое окно с Gemini 2.5 Flash, увиденным в Google AI Studio поток язык. Генерация контролируемых речей (TTS) доступно в предварительном просмотре для Gemini 2.5 Pro и Flash, выбрав генерацию речей в генерировать носитель Вкладка в Google AI Studio.

Source

ЧИТАТЬ 7 способов сделать Android более доступным