API Interactions расширяет базовую функциональность генерировать контент с функциями, необходимыми для современных агентских приложений, в том числе:

  • Необязательное состояние на стороне сервера: Возможность выгрузки управления историей на сервер. Это упрощает клиентский код, сводит к минимуму ошибки управления контекстом и может привести к снижению затрат за счет повышения риска попадания в кэш.
  • Интерпретируемая и составная модель данных: Чистая схема, разработанная для сложных агентных историй. Вы можете отлаживать, манипулировать, распространять и рассуждать о сообщениях, мыслях, инструментах и ​​их взаимосвязанных результатах.
  • Запуск в фоновом режиме: Возможность разгрузки длительных циклов вывода на сервер без поддержания соединений на стороне клиента.
  • Поддержка удаленного инструмента MCP: Модели могут напрямую вызывать серверы протокола контекста модели (MCP) в качестве инструментов.

Наши мотивы для нового API

Модели становятся системами и со временем могут даже сами стать агентами. Когда мы разрабатывали функциюgenerateContent, основным вариантом использования была генерация текста запроса-ответа без сохранения состояния. Он отлично работает для чат-ботов и выполнения задач.

С тех пор ландшафт изменился. С появлением новых функций шаблонов, таких как «отражение» и расширенного использования инструментов, мы услышали много отзывов о предоставлении собственного интерфейса, предназначенного для поддержки этих сложных шаблонов взаимодействия. По мере того, как мы расширяем экосистему Gemini от моделей до полностью управляемых агентов, таких как Gemini Deep Research, попытка принудительного использования этих возможностей вgenerContent привела бы к слишком сложному и хрупкому API.

Хотя API Interactions поддерживает большинство функцийgenerContent и обеспечивает более надежные возможности разработки, в настоящее время он находится на стадии общедоступной бета-версии и поэтому все еще может подвергаться значительным изменениям. Для стандартных производственных рабочих нагрузокgenerateContent остается основным путем и будет продолжать развиваться и поддерживаться.

ЧИТАТЬ  Bing Chat повышает эффективность и сокращает задержки на 25 %.

Для начала

Вы можете начать разработку общедоступной бета-версии Interactions API уже сегодня, используя ключ API Gemini Google AI Studio, следуя инструкциям. API-документация. Вы также можете проверить спецификацию OpenAPI. здесь.

Мы хотим быть уверены, что этот API решает реальные проблемы, с которыми вы сталкиваетесь при перемещении агентов в рабочую среду, и в то же время позволяет вам беспрепятственно создавать новые облегченные возможности. Поэтому мы рекомендуем вам протестировать его и поделитесь своими комментариями.

Мы стремимся внедрить эти функции в более широкую экосистему с открытым исходным кодом, чтобы вы могли использовать их со своими любимыми инструментами. Во-первых, комплект разработки агента (ADK) и протокол Agent2Agent (A2A). теперь поддерживаю API взаимодействий. В ближайшие месяцы вы можете ожидать более широкой поддержки других инструментов. API Interactions API и Gemini Deep Research скоро будут доступны на Vertex AI.

Source