Эта история — реальный пример одного из способов заставить ChatGPT делать именно то, что вы хотите, а не только то, что происходит.
Спойлер: В итоге я получил от ChatGPT то, что хотел. Однако путь, который нам пришлось пройти, сильно напоминает комедию с элементами детектива.
Спойлер: подсказка присутствует. Может быть полезно для сортировки полуструктурированных текстовых таблиц с информацией.
Условия задачи:
Мне нужно было написать сценарий документального ролика продолжительностью около часа, с элементами анализа. Скажем, об Илоне Маске (все имена и выступления вымышлены и не имеют никакого отношения к нашей реальности).
Исследовать
С помощью ChatGPT я отлично справился со сбором исходной информации:
-
Я дал ему задание найти источники на русском и английском языках со ссылками на первоисточник.
-
Я придал ему стиль презентации. В противном случае он не просто ищет информацию, но РАССКАЗЫВАЕТ ее. Так что, по крайней мере, он рассказывает это в правильном стиле, а не в своем стерилизованном, доброжелательном, политкорректном стиле.
-
Я часто соглашался с его предложениями предоставить дополнительные подробности.
-
Если всплывал интересный нюанс, я просил его дать мне информацию и об этом.
Одним словом, я был счастлив.
Я искренне рекомендую ChatGPT в ситуациях, когда вам нужно провести углубленное исследование популярных тем.
Конечным результатом стал 120-страничный файл, содержащий плохо структурированную информацию.
Плохо структурировано, потому что, когда его просят «рассказать подробно», он начинает с контекста и заканчивает выводами. Да и я постоянно отклонялся от основного плана, чтобы собрать дополнительную информацию.
Потом мне пришлось систематизировать этот 120-страничный файл, иначе я бы в нем утонул.
Попытка 1
Первая логичная мысль: попросить ChatGPT отсортировать этот файл по временной шкале, то есть в хронологическом порядке. Разве это не логичная идея?
Стало ясно 2 вещи:
-
120 страниц в него не поместятся. Ну это не беда, можно попробовать частями.
-
Он уже забыл то, что сам нашел и рассказал мне.
Второе критично. Делает сортировку невозможной.
Попытка 2
Ладно, я решил попробовать передать ему собранную им информацию и рассказать ее мне согласно таймлайну.
У ChatGPT есть две проблемы, которые меня очень раздражают:
-
Доброжелательный и глупый американский стиль изложения. Что касается термина «глупый», то претензии не ко мне, а к Михаилу Задорнову, который обнаружил и обосновал этот факт.
-
Он стерилизует оборудование. Из материала исчезают конкретные имена, даты и географические названия. То, что остается, — это выхолощенное повествование с повествованием «за все добро против всего зла».
С этим можно бороться, но нужно помнить об этой особенности.
Я этого не помнил, и материал, созданный для меня ChatGPT, показался мне милой-милой сказкой.
Есть два выхода:
-
Обучить ChatGPT. Но я работаю над разными текстами, и не уверен, что оно меня обучило и не испортит все последующие документы.
-
В каждой подсказке дайте инструкции по стилю написания и сохранению фактических данных. Даже если это не поможет.
Попытка 3
Хорошо, я придал этому стиль презентации. Он твердо приказал сохранить все фактические данные. Он категорически приказал мне записать все подробности!
Результат оказался… ну, скажем так, парадоксальным.
Он рассказал мне это в хорошем стиле, с множеством подробностей.
Однако неожиданно я столкнулся с новыми именами и событиями.
Я подумал, может быть, это информация из какого-то исходного материала, который я еще не читал?
Но тот факт, что мать условного Илона Маска теперь носит другое имя, вызвал у меня смутные сомнения…
Оказалось, что половину он придумал сам и качественно включил в исходную информацию.
Таким образом, эксперимент снова провалился.
Попытка 4
Но я упрямый. Мне лень целый день сортировать информацию вручную. Я лучше проведу два дня за компьютером!
Я спросил ChatGPT, как он посоветует решить проблему.
Он посоветовал нам аннотировать исходный материал. С чем мне в конечном итоге пришлось согласиться.
Маркировку я сделал. Он твердо приказал ни в коем случае не изменять первоначальный текст. Отправлен на казнь.
И что? Думаешь, на этом все закончилось?
Получив материалы от ChatGPT, я бегло взглянул на происходящее и остался доволен! Материал, который был перед моими глазами, был заказан в соответствии с моими идентификаторами!
А потом я проверил, сколько сырья я задал в ГПТ и получил.
Полученный оказался примерно в 2 раза меньше (((
Нет, я конечно понимаю, что много информации продублировано в исходном материале, потому что делал несколько поисков. Но вопрос в том, что он удалил — менее или более подходящие для меня блоки информации?
Потом у нас с ним состоялся разговор. Если кратко, то скажу своими словами:
Я: Слушай, это еще не вся информация…
Он: Всё.
Я: Вернуть текст в его предварительно отредактированное состояние.
Он: Я вернул его.
Я: Ну смотри, вот предложение «ХХХ», а в итоговом документе его нет?
Он: Здесь нет выражения «ХХХ».
Я: Что это?
Он: Это предложение отсутствует в модели обрабатываемого документа. Обновить модель?
Я: Ну, обновите.
Он: Я не могу обновить модель, форматирование может быть слишком сложным. И обычно ваш лимит истек; продолжение работы возможно через 3 часа.
Попытка 5
Я уже решил сдаться и сделать это вручную. Но тут мне в голову пришла информация, что GPT основан на векторизации.
Другими словами, я вижу текст. Но вместо этого текста он видит цифры.
И если у меня перед глазами два очень похожих блока текста, то перед глазами у меня одинаковое число. Зачем ему два одинаковых числа? Одного достаточно.
Это дало мне решение. Я решил использовать агентскую систему.
Вот что об этом говорит ChatGPT: Это может быть эффективный и структурированный способ решения сложных проблем. Этот подход называется мультиагентная схема и работает как конвейер, в котором результат одного шага передается на следующий.
Получается, что если дать ChatGPT шизофрению, то есть раздвоение личности (расстройство и т. д.), то можно лучше контролировать каждый отдельный этап обработки информации. Потому что для этих лиц внутри ТГП задача упрощается, так как снижается взаимное влияние этапов обработки информации.
Это уже не интересно, поэтому всё заработало.
Единственное, скачивать подлежащие обработке файлы лучше в формате TXT. В этом случае ChatGPT предлагает скачать итоговый файл в формате TXT. При попытке загрузить файл в формате PDF результирующий файл создается на холсте. И могут быть сюрпризы. Или вам нужен третий агент для отображения на холсте. Шизофрения настолько… многогранна.
Вот рабочая подсказка:
Перед нами стоит многоэтапная задача: нужно разобрать текст на смысловые блоки.
Условия:
— Исходный документ: текст отправлен на обработку.
— Итоговый документ: текст, полученный в результате обработки.
— Идентификатор: пять символов в формате «::NNN», где «NNN» состоит из трех цифр.
— Блок текста: неизменяемый блок текста, начинающийся с идентификатора и заканчивающийся перед следующим идентификатором или в конце документа.
Важно: Текстовые блоки нельзя редактировать, сокращать, перефразировать, форматировать или удалять. Вы можете только изменить их порядок.
Этапы обработки:
Мы используем двух агентов: аналитика и архивариуса. Каждый выполняет свою часть работы.
1. Аналитик:
— Определяет текстовые блоки в исходном документе.
— Передает каждый блок текста архивисту с его идентификатором.
2. Архивариус:
— Получает текстовые блоки и идентификаторы от аналитика.
— Вставляет блок текста в результирующий документ.
Порядок вставки:
1. Если в результирующем документе уже есть блоки с таким идентификатором, новый блок размещается после них.
2. Если блоков с одинаковым идентификатором нет, новый блок размещается после всех блоков с меньшими идентификаторами.
Пример:
Исходный документ:
::002
Это текст блока 002.
::001
Это текст блока 001.
::003
Это текст блока 003.
Итоговый документ:
::001
Это текст блока 001.
::002
Это текст блока 002.
::003
Это текст блока 003.
КОНЕЦ