- Разработан новый ИИ, который может распознавать сложные визуальные данные
- SMAST может обучаться и прогнозировать сложные действия человека
- По словам исследователей, этот инструмент можно использовать в сфере наблюдения, здравоохранения и автономного вождения.
Исследователи из Школы инженерных и прикладных наук Университета Вирджинии продвинули возможности искусственного интеллекта по визуальным данным на шаг дальше, предложив свою последнюю инновацию — управляемый искусственным интеллектом видеоанализатор под названием «Семантическая и ориентированная на движение пространственно-временная трансформаторная сеть» (SMAST).
Эта система обеспечивает точность распознавания действий человека и перспективные применения в таких областях, как общественная безопасность, отслеживание движения и даже автономная навигация транспортных средств.
В основе возможностей SMAST лежит способность обрабатывать сложные видеоматериалы, концентрируясь на наиболее важных частях сцены.
Система объединяет многофункциональную модель избирательного внимания и алгоритм 2D-кодирования положения с учетом движения. Эти функции работают вместе, чтобы гарантировать, что ИИ может точно распознавать и интерпретировать действия человека.
Модель избирательного внимания позволяет SMAST сосредоточиться на важных элементах, таких как человек или движущийся объект, игнорируя при этом несущественные детали. Например, он может определить, бросает ли кто-то мяч или просто поднимает руку.
Между тем, алгоритм распознавания движения позволяет ИИ отслеживать движения с течением времени и запоминать, как объекты и люди перемещались в пределах сцены. Это дает SMAST возможность понимать взаимосвязь между различными действиями и, таким образом, более эффективно обнаруживать сложное поведение.
В области безопасности и наблюдения система SMAST может повысить общественную безопасность, обнаруживая потенциальные угрозы в режиме реального времени. Например, он может обнаружить подозрительное поведение в переполненной комнате или определить, находится ли кто-то в беде. В здравоохранении эту технологию можно использовать для отслеживания движений пациентов, что позволит лучше анализировать движения для реабилитации или мониторинга во время операции.
По мнению исследователей, SMAST выделяется своей способностью обрабатывать хаотичные, неотредактированные кадры. Подход SMAST, основанный на искусственном интеллекте, очевидно, позволяет ему учиться на данных, адаптироваться к различным средам и улучшать свои возможности распознавания действий. Инструмент прошел несколько академических тестов, включая AVA, UCF101-24 и EPIC-Kitchens, и показал себя достаточно хорошо.
«Эта технология искусственного интеллекта открывает двери для распознавания действий в режиме реального времени в некоторых из самых сложных условий», — сказал профессор и заведующий кафедрой электротехники и вычислительной техники Скотт Т. Эктон. «Это тот прогресс, который может помочь предотвратить несчастные случаи, улучшить диагностику и даже спасти жизни».
Над ТехЭксплор