Vision Agent в действии
Включив выполнение кода в API, вы сможете разблокировать множество новых возможностей поведения, многие из которых описаны в нашей статье. демо-приложение в Google AI Studio. От крупных продуктов, таких как приложение Gemini, до небольших стартапов, разработчики уже начали интегрировать возможность разблокировать множество вариантов использования, в том числе:
1. Увеличьте масштаб и осмотрите
Gemini 3 Flash обучена неявно масштабировать при обнаружении мелких деталей.
PlanCheckSolver.comПлатформа проверки плана здания на базе искусственного интеллекта повысила точность на 5 % за счет возможности выполнения кода с помощью Gemini 3 Flash для итеративной проверки входных данных с высоким разрешением. Видео серверных журналов демонстрирует этот процесс агента: Gemini 3 Flash генерирует код Python для обрезки и анализа определенных областей (например, краев крыши или секций здания) как новых изображений. Добавляя эти культуры во всплывающее окно, модель визуально обосновывает свои аргументы и подтверждает соответствие сложным строительным нормам.

