Давайте углубимся в эту новую способность и в то, как она помогает Барду улучшить свои ответы.
Улучшение логики и навыков рассуждения
Модели больших языков (LLM) подобны механизмам прогнозирования: когда они получают приглашение, они генерируют ответ, предсказывая, какие слова, скорее всего, будут следующими. В результате они были чрезвычайно сильны в языке и творческих задачах, но слабее в таких областях, как рассуждение и математика. Чтобы помочь решить более сложные проблемы с помощью расширенных рассуждений и логических возможностей, недостаточно полагаться только на вывод LLM.
Наш новый метод позволяет Барду генерировать и выполнять код, укрепляющий его логические и вычислительные навыки. Этот подход основан на хорошо изученной дихотомии человеческого интеллекта, особенно обсуждаемой в книге Даниэля Канемана «Мышление, быстрое и медленное» — разделение мышления на «Систему 1» и «Систему 2».
- Мышление Системы 1 быстрое, интуитивное и легкое. Когда джазовый музыкант импровизирует на месте или машинистка думает о слове и смотрит, как оно появляется на экране, он использует мышление Системы 1.
- Мышление Системы 2, с другой стороны, медленное, обдуманное и требовательное. Когда вы выполняете деление в длину или учитесь играть на инструменте, вы используете систему 2.
По этой аналогии LLM можно рассматривать как работающие только в Системе 1 — производящие текст быстро, но без глубоких размышлений. Это приводит к невероятным способностям, но может неожиданно потерпеть неудачу. (Представьте, что вы пытаетесь решить математическую задачу, используя только Систему 1: вы не можете остановиться и произвести арифметические действия, вы просто выдаете первый ответ, который приходит на ум.) Традиционное исчисление тесно связано с мышлением Системы 2: оно шаблонно и негибко. , но правильная последовательность шагов может привести к впечатляющим результатам, например к решениям для деления в длинную сторону.
В этом последнем обновлении мы объединили возможности LLM (Система 1) и традиционного кода (Система 2), чтобы повысить точность ответов Барда. При неявном выполнении кода Bard идентифицирует подсказки, которые могли бы выиграть от логического кода, записывает их «под капотом», выполняет и использует результат для создания более точного ответа. До сих пор мы видели, что этот метод повышает точность ответов Барда на текстовые и математические задачи, основанные на вычислениях, примерно на 30% в наших внутренних наборах данных.
Даже с этими улучшениями Bard не всегда будет делать это правильно — например, Bard может не генерировать код для обеспечения быстрого реагирования, генерируемый им код может быть неправильным или Bard может не включать исполняемый код в свой ответ. Тем не менее, эта улучшенная способность отвечать структурированными и логическими способностями является важным шагом к тому, чтобы сделать Барда еще более полезным. Оставайтесь с нами, чтобы узнать больше.