- Длительное доминирование InfiniBand находится под реальным давлением со стороны движения за открытые стандарты Ethernet.
- Meta и Nvidia полагаются на открытость для масштабирования сетей искусственного интеллекта
- Проект ESUN объединяет конкурентов отрасли посредством общих сетевых амбиций.
Открытый вычислительный проект (OCP) объявила о новой инициативе под названием Ethernet для масштабируемых сетей (ESUN), целью которой является разработка открытых стандартов для высокопроизводительных межсоединений в кластерах искусственного интеллекта.
Это сотрудничество объединяет такие компании, как Meta, Nvidia, AMD, Cisco и OpenAI, чтобы изучить, как Ethernet может конкурировать с существующими соединениями, такими как InfiniBand, в крупных центрах обработки данных.
К сотрудничеству присоединяются и другие компании: Arista, ARM, Broadcom, HPE Networking, Marvell, Microsoft и Oracle.
Открытая сеть для кластеров ИИ
InfiniBand уже давно доминирует на рынке высокоскоростных сетей искусственного интеллекта, на его долю приходится около 80% инфраструктуры подключения. Графические процессоры и ускорители.
Однако группа ESUN считает, что Ethernet является хорошим кандидатом для масштабирования кластеров искусственного интеллекта благодаря своей зрелости, экономической эффективности и совместимости.
В отличие от проприетарных систем, широкое распространение Ethernet среди инженеров может помочь снизить сложность управления огромными рабочими нагрузками ИИ.
Сторонники утверждают, что использование Ethernet в качестве открытого стандарта позволит операторам масштабировать инфраструктуру при одновременном снижении затрат.
Новая инициатива OCP по инструментам искусственного интеллекта основана на предыдущей работе в рамках программы SUE Transport (SUE-T), в которой исследовался транспорт Ethernet для многопроцессорных систем.
Участники ESUN регулярно встречаются, чтобы определить стандарты поведения коммутатора, включая заголовки протоколов, обработку ошибок и передачу данных без потерь.
Группа также изучит, как проектирование сети влияет на балансировку нагрузки и порядок памяти в системах на базе графических процессоров.
Он планирует координировать свои действия с Консорциумом Ultra Ethernet и Советом по стандартизации IEEE 802.3, чтобы обеспечить согласованность всей экосистемы Ethernet.
Несколько компаний уже разработали продукты на базе Ethernet, предназначенные для масштабирования искусственного интеллекта: например, коммутатор Tomahawk Ultra от Broadcom поддерживает до 77 миллиардов пакетов в секунду, а платформа Spectrum-X от Nvidia также сочетает в себе Ethernet с аппаратным ускорением для кластеров искусственного интеллекта.
Но Мета, соучредитель OCP в 2011 году, рассматривает ESUN как естественное продолжение своего стремления к открытому оборудованию в центрах обработки данных.
Тем не менее, наблюдатели отмечают, что замена существующих сетей InfiniBand потребует, чтобы Ethernet зарекомендовал себя в самых требовательных рабочих нагрузках ИИ, где задержка и надежность имеют решающее значение.
Успех ESUN будет зависеть от баланса между открытостью и производительностью. Сторонники видят будущее, в котором системы искусственного интеллекта будут работать на совместимом оборудовании с использованием стандартизированных технологий Ethernet.
Однако, учитывая масштаб и чувствительность инфраструктуры искусственного интеллекта, остается неясным, произойдет ли решительный отход динамики отрасли от частных связей.
На данный момент ESUN представляет собой амбициозную попытку, и пока неизвестно, сможет ли она сравниться по производительности с InfiniBand.
Следите за TechRadar в Новостях Google. И Добавьте нас в качестве предпочтительного источника чтобы получать новости, обзоры и мнения наших экспертов в своих лентах. Обязательно нажмите кнопку «Подписаться»!
И ты, конечно, тоже можешь Следите за TechRadar в TikTok за новостями, обзорами, распаковками в видео-форме и получайте от нас регулярные обновления WhatsApp к.