Исследователи из Сингапурского университета технологий и дизайна (SUTD) разработали новое программное обеспечение, ориентированное на обучение с подкреплением и память с фазовыми изменениями, предназначенное для понимания сложных конструкций движения.

В предыдущей работе этот тип глубокого обучения применялся к другим играм, таким как шахматы или го, но вместо этого они решили привести алгоритм D-PPO в соответствие с требованиями Street Fighter Champion Edition II. Исследователи SUTD тренировали своего ИИ-игрока SF-R2 против компьютера в течение двух дней подряд, прежде чем обрушить его на человека-участника, которого система на базе ИИ явно победила.

Source