«Никто еще не знает»: дизайн пончиков может создать вычислительных монстров с квадриллионами транзисторов – аналитики обсуждают необычное соединение, поскольку генеральный директор Cerebras признает, что мы не знаем, что происходит, когда подключены несколько WSE • Продвижение Web 2.0

Tri-Labs (состоящая из трёх крупнейших исследовательских институтов США — Ливерморской национальной лаборатории Лоуренса (LLNL), Сандийских национальных лабораторий (SNL) и Лос-Аламосской национальной лаборатории (LANL)) уже много лет сотрудничает с ИИ-компанией. Мозги по ряду научных проблем, включая преодоление временного барьера молекулярной динамики (МД).

Существует документ, который объясняет эту конкретную проблему. Вы можете прочитать это Здесьно по сути это относится к проблеме проведения молекулярно-динамического моделирования в большем временном масштабе, чем это обычно возможно.

Здесь есть два препятствия: вычислительная мощность и задержка связи между различными узлами системы HPC. Чтобы компенсировать недостаток вычислительной мощности, ученые традиционно поручают каждому узлу больше работы и масштабируют размер моделирования в зависимости от количества узлов. К сожалению, медленная связь между узлами, вызванная высокой задержкой, еще больше усугубляет проблему синхронизации.

Как пончик

МД-моделирование имеет решающее значение для нескольких научных областей, поскольку оно устраняет разрыв между методами квантовой электроники и методами механики сплошной среды. Однако эти симуляции имеют ограничения по времени, поскольку они должны учитывать атомные колебания, которые происходят в очень коротких временных масштабах, и другие явления, которые происходят в гораздо более длительных временных масштабах.

Авторы статьи попытались преодолеть временной барьер, используя более эффективную вычислительную систему, в частности процессор Cerebras.

Как Следующая платформа объясняет: «Конкретное моделирование заключалось в направлении излучения на три различные кристаллические решетки, состоящие из вольфрама, меди и тантала. В этих конкретных симуляциях, где каждая решетка содержала 801 792 атома, идея заключалась в том, чтобы бомбардировать решетки радиацией и посмотреть, что произойдет».

Моделируя на Frontier, самом быстром в мире суперкомпьютере в Национальной лаборатории Ок-Ридж в Теннесси, и на Quartz в LLNL, ученые смогли всего за наносекунды наблюдать, что происходит с сетками, когда они подвергаются бомбардировке радиацией. В случае с WSE у них были десятки миллисекунд, чтобы наблюдать за происходящим.

Для тестирования Tri-Labs использовала Cerebras Wafer Scale Engine 2 (WSE-2) вместо более нового и мощного WSE-3, выпущенного ранее в этом году. Однако, как описано выше, результаты были впечатляющими. В документе говорится: «Назначая процессорное ядро каждому моделируемому атому, мы демонстрируем 179-кратное улучшение количества шагов в секунду по сравнению с экзафлопсной платформой Frontier на базе графического процессора, а также значительное улучшение количества шагов по времени на единицу энергии. Сокращение продолжительности каждого года до двух дней открывает недоступные в настоящее время масштабы медленных процессов микроструктурной трансформации, которые имеют решающее значение для понимания поведения и функционирования материала».

Следующая платформаТимоти Прикетт Морган спросил генерального директора и соучредителя Cerebras Эндрю Фельдмана, что происходит, когда вы соединяете несколько двигателей размером с пластину вместе и пытаетесь запустить одно и то же моделирование, и ему ответили: «Никто еще не знает».

Прикетт Морган далее отметил: «Проприетарное соединение в системах WSE-2 масштабировалось до 192 устройств, а с WSE-3 это число увеличилось более чем на порядок до 2048 устройств», но он «сильно подозревает, что «то же самое принципы масштабирования применимы к WSE как к графическим процессорам, так и к процессорам».

Тем не менее, он также предположил, что может быть способ физически связать WSE вместе и создать «дымовую трубу из квадратов взаимосвязанных WSE», потенциально создав кольцевую конструкцию, в которой питание подается внутри, а охлаждение — снаружи. Прикетт Морган заключает: «Этот тип конфигурации не может быть хуже, чем использование InfiniBand или Ethernet для подключения процессоров или графических процессоров».

ЧИТАТЬ Как применить EAET на ваш сайт и повысить SEO на странице

Больше от TechRadar Pro

Source