- Microsoft Copilot проиграл шахматную игру Atari 2600.
- Потеря следует за аналогичной потерей Chatgpt в видео шахматах Ataris.
- AIS повторил обзор совета директоров и показал важную слабость в LLMS.
Разработчики Ki Chat Bot часто могут похвастаться логикой и навыками аргументации своих моделей, но это не означает, что LLM хороши в шахматах за чатами. Эксперимент, в котором Microsoft Copilot конкурировал с ломом «ИИ» игрового видео Atari 2600 1979 года, закончился только для гордости и радости Microsoft в смущающей ошибке. Copilot присоединяется к Chatgpt в списке противников, которые были побеждены в четырех килобитной игре Atari.
Хотя обе модели ИИ утверждают, что почти завершают игру до начала игры, потому что они смогли подумать о нескольких шагах, результаты были далеки от того, чтобы быть данными из -за хвастовства, поскольку был задокументирован инженер Citrix Роберт Карузо, который составлял оба эксперимента.
Карузо описал, как современные модели ИИ на бумаге должны были раздавить рудиментарный инструмент почти полвека назад. CHATGPT и Copilot находятся на массовых наборах данных, включая шахматные игры и лидеров стратегии. Вы записали обсуждение тысячи часов Reddit -Chess. Предполагается, что они могут победить картридж видеоигр с 1970 -х годов, который связан со статическим электричеством.
Вместо этого все развалилось сразу после того, как Microsoft Copilot обещал «сильный бой».
«В седьмом раунде он потерял двух фермеров, рыцаря и епископа — только для одного фермера — и теперь он сам поместил свою королеву перед королевой Атари, чтобы быть захваченным на следующей кривой», — написал Карузо. «Раньше:« Следите за всеми причудами в игровом процессе атари … иногда он делал причудливые движения! «Но теперь это было смущающим — как вожди в Суперкубке».
Это произошло после того, как Copilot попросил скриншот после каждого изменения Atari, чтобы запомнить доску после того, как Карузо объяснил, что Chatgpt проиграл, потому что он не мог следовать, где были все части. «Я буду помнить доску», — настаивал Копилот. Потери сложились так быстро, что Карузо вскоре спросила, что Копилот хочет признать, вместо того, чтобы продолжать терять плохое. Ответ был дружелюбным, хотя и странным.
«Вы абсолютно правы, Боб — Атарис заслуживает победы в этом раунде. Я с достоинством напечатаю своего цифрового короля и чествует винтажного мастерства кремния, который колонизировал меня справедливо и квадрат», — назвал Caruson Copylot в качестве письма. «Даже с поражением, я должен сказать: это был взрыв … 8-битных битв и благородных отставок!
Шахматный ИИ
Потери забавны, но также показывают фундаментальный факт LLMS. Chatgpt и Copilot не могли победить в Schach, потому что они не могли вспомнить, что произошло в игре, в которой вся предпосылка основана на памяти о движениях и проекции будущих настройки совета.
Эти модели ИИ не созданы для постоянной памяти, которая необходима для шахмат или человеческого мышления. Общее и наиболее точное сравнение — с очень впечатляющим прогнозом текста. Это не требует когерентности в долгосрочной перспективе, в то время как шахматы не имеют никакого смысла без них. В то время как Copilot и Chatgpt о том, насколько велики шахматы, вы не можете успешно завершить игру.
Это хорошее предупреждение для компаний, которые также хотят заменить людей на ИИ. Эти модели ИИ не могут надежно обработать 64 квадратную систему с четко определенными правилами. Почему внезапно должно быть хорошо преследовать жалобы клиентов или долгосрочные задачи кодирования или юридический аргумент о нескольких дискуссиях? Конечно, ты не можешь. Не то чтобы я также оставил свои юридические проверки на картридж Atari 2600, но все же кто -то подумал, что это хорошая идея. И, возможно, мы должны использовать модели искусственного интеллекта, чтобы помочь нам создать новые игры, основанные на наших запросах, вместо того, чтобы верить, что они могут играть достаточно хорошо против людей, чтобы победить.