Это означало, что было бы невозможно создать базу данных со всем функционалом. Вместо этого мы опубликовали Альфафолд сервербесплатный инструмент, который позволяет ученым вставлять свои собственные последовательности, для которых AlphaFold затем может генерировать молекулярные комплексы. С момента запуска в мае исследователи уже использовали его для создания более миллиона структур.

«Это похоже на Google Maps для молекулярных комплексов», — говорит Линдси Уиллмор, инженер-исследователь Google DeepMind. «Любой пользователь, который вообще не умеет программировать, может просто скопировать и вставить последовательности своих белков, ДНК, РНК или название своей небольшой молекулы, нажать кнопку и подождать несколько минут. Их структура и меры достоверности будут отображены, что позволит им просмотреть и оценить свой прогноз. »

Чтобы AlphaFold 3 работал с гораздо более широким диапазоном биомолекул, команда значительно расширила данные, на которых обучалась новая модель, включив в нее ДНК, РНК, малые молекулы и многое другое. «Мы смогли сказать: «Давайте просто потренируемся на всем, что существует в этом наборе данных, что так помогло нам с белками, и посмотрим, как далеко мы сможем зайти», — говорит Линдси. «И оказывается, мы можем зайти довольно далеко». »

Еще одним важным изменением в AlphaFold 3 является изменение архитектуры последней части модели, генерирующей структуру. В то время как AlphaFold 2 использовал сложный модуль, основанный на пользовательской геометрии, AlphaFold 3 использует генеративную модель на основе диффузии, похожую на другие наши современные модели генерации изображений, такие как Картина — что значительно упростило способ обработки моделью всех новых типов молекул.

Однако это изменение привело к новой проблеме: поскольку так называемые «неупорядоченные области» белков не были включены в обучающие данные, диффузионная модель попыталась создать неточную «упорядоченную» структуру с определенной спиральной формой вместо прогнозирование неупорядоченных областей.

ЧИТАТЬ  НАСА объявляет дату попытки возвращения Starliner | Цифровые тенденции

Поэтому команда обратилась к AlphaFold 2, который уже очень хорошо предсказывает, какие взаимодействия будут беспорядочными (те, которые похожи на хаотичную кучу спагетти), а какие нет. «Мы смогли использовать эти структуры, предсказанные AlphaFold 2, в качестве тренировки для AlphaFold 3, чтобы AlphaFold 3 мог научиться предсказывать расстройства», — говорит Линдси.

«У нас есть поговорка: «Доверяй фузилли, отвергай спагетти», — добавляет Йонас.

Source