Цель справедливость в отношении здоровья заключается в том, чтобы гарантировать каждому справедливый и равный шанс достичь наивысшего уровня здоровья. Реальность является противоположной для слишком многих людей, включая цветных людей, женщин, жителей сельских общин и других исторически маргинализированных групп населения. Как глава Google по вопросам равенства в здравоохранении, моя команда стремится к тому, чтобы мы создавали инструменты здравоохранения на базе искусственного интеллекта ответственно и справедливо.

На нашем ежегодном мероприятии, посвященном здоровью, The Check Up, мы рассказали о трех способах, которыми мы помогаем создать более справедливое будущее.

Наше недавнее исследование по выявлению и смягчению предвзятости

Поскольку медицинский ИИ быстро развивается, крайне важно разработать инструменты и ресурсы, которые можно использовать для выявления и смягчения предубеждений, которые могут негативно повлиять на состояние здоровья. Наше новое исследование «Инструментарий для выявления предвзятости и предубеждений в отношении справедливости в отношении здоровья в основных языковых моделях«, является шагом в этом направлении. В этой статье представлена ​​основа для оценки того, могут ли большие модели медицинского языка (LLM) увековечивать исторические предвзятости, и в качестве руководства представлена ​​коллекция из семи наборов данных состязательного тестирования под названием «EquityMedQA».

Эти инструменты основаны на литературе о неравенстве в отношении здоровья, реальных неудачах моделей и совместном вкладе экспертов по вопросам равенства. Мы использовали эти инструменты для оценки наших собственных больших языковых моделей, и теперь они доступны исследовательскому сообществу и за его пределами.

Новая основа для измерения справедливости в отношении здоровья с помощью моделей ИИ

Группа исследователей справедливости в отношении здоровья, социологов, клиницистов, специалистов по биоэтике, статистиков и исследователей искусственного интеллекта собралась в Google, чтобы разработать основу для создания искусственного интеллекта, который позволяет избежать создания и усиления несправедливых предрассудков.

ЧИТАТЬ  Цена этого 86-дюймового телевизора LG 4K упала с 1250 до 800 долларов | Цифровые тенденции

Эта структура, называемая HEAL (оценка справедливости машинного обучения в отношении здоровья), предназначен для оценки вероятности того, что технология искусственного интеллекта будет работать справедливо, и для предотвращения развертывания моделей искусственного интеллекта, которые могут усугубить неравенство, особенно для групп, которые в среднем имеют более низкие показатели здоровья. Четырехэтапный процесс включает в себя:

  1. Определите факторы, связанные с неравенством в отношении здоровья, и определите показатели эффективности ИИ.
  2. Выявить и количественно оценить ранее существовавшие различия в показателях здоровья.
  3. Измерьте производительность инструмента искусственного интеллекта для каждой подгруппы населения.
  4. Оцените вероятность того, что инструмент ИИ будет уделять приоритетное внимание производительности с учетом различий в состоянии здоровья.

Мы уже использовали эту платформу для тестирования модели искусственного интеллекта в дерматологии. Результаты показали, что, хотя эта модель одинаково работала для всех расовых, этнических и гендерных подгрупп, мы могли внести улучшения для достижения лучших результатов для старших возрастных групп. В рамках исследования было обнаружено, что когда дело дошло до оценки раковых заболеваний, таких как меланома, модель работала справедливо во всех возрастных группах, но что для нераковых состояний, таких как экзема, она не работала так же хорошо в возрастной группе 70+.

В будущем мы продолжим применять эту структуру к моделям искусственного интеллекта в здравоохранении, а также будем развивать и совершенствовать ее в процессе.

Более репрезентативный набор данных для развития дерматологии

Сегодня многие наборы дерматологических данных не являются репрезентативными для населения, что затрудняет создание справедливых моделей ИИ для разработчиков. Изображения в текущих наборах данных часто создаются в клинической среде и могут не отражать разные части тела, разные уровни тяжести заболевания или разные оттенки кожи, возраст, пол и т. д. И они сосредоточены в первую очередь на серьезных проблемах, таких как рак кожи, а не на более распространенных проблемах, таких как аллергические, воспалительные или инфекционные заболевания.

ЧИТАТЬ  Квантовое компьютерное образование для лидеров мировой политики

Чтобы создать более репрезентативный набор изображений, мы сотрудничали со Stanford Medicine в Сеть изображений состояния кожи (SCIN). Тысячи людей предоставили более 10 000 реальных дерматологических изображений для создания этого набора данных с открытым доступом. Затем дерматологи и исследовательские группы помогли определить диагнозы на каждом изображении и обозначить их на основе двух шкал оттенков кожи, чтобы гарантировать, что они включают широкий спектр состояний и типов кожи.

Ученые и врачи теперь могут использовать набор данных SCIN, чтобы разработать инструменты для выявления дерматологических проблем, проводить исследования, связанные с дерматологией, а также знакомить студентов-медиков с большим количеством примеров кожных заболеваний и их проявлений на различных типах кожи.

Мы находимся в начале этого пути, но полны решимости изменить ситуацию. Мы считаем, что работа с партнерами и обмен нашими знаниями могут помочь построить более здоровое будущее для всех, независимо от происхождения или местоположения.

Source