Текущие ссылки ИИ пытаются не отставать от темпов современных моделей. Как бы это ни было полезно для измерения производительности модели по конкретным задачам, может быть трудно понять, действительно ли модели, формируемые на данных Интернета, решают проблемы или просто запомнить ответы, которые они уже видели. В то время как модели достигают более 100% на определенных критериях, они также становятся менее эффективными в выявлении различий в значительной производительности. Мы продолжаем инвестировать в новые и более сложные ссылки, но на путь общего интеллекта мы должны продолжать искать новые способы оценки. Самое последнее изменение в направлении динамических и предполагаемых человеческих тестов решает эти проблемы запоминания и насыщения, но, в свою очередь, создает новые трудности, возникающие в результате неотъемлемой субъективности человеческих предпочтений.
Хотя мы продолжаем развиваться и продолжаем текущие ссылки на IA, мы также стремимся проверить новые подходы к оценке моделей. Вот почему сегодня мы представляем Kaggle Game Arena: Новая сравнительная общественная платформа анализа искусственного интеллекта, где модели искусственного интеллекта конкурируют в стратегических играх, предоставляя проверку и динамическую меру их способностей.