«Для многих приложений искусственного интеллекта графические процессоры представляют собой перегрузку вычислительной мощности и потребляют гораздо больше энергии и денег, чем необходимо»: как Ampere Computing хочет оседлать волну искусственного интеллекта • Продвижение Web 2.0

Амперные вычисления — это стартап, который производит фурор в технологической индустрии, бросая вызов доминированию таких технологических гигантов, как AMD, Nvidia и Intel. С появлением ИИ потребность в вычислительной мощности резко возросла, равно как и затраты на электроэнергию и спрос на электросети. Ampere хочет решить эту проблему с помощью высокопроизводительного решения с низким энергопотреблением.

Несмотря на то, что предложение Ampere является аутсайдером, оно было принято почти всеми крупными гиперскейлерами по всему миру. Она несколько раз преодолевала стену масштабирования со своими процессорами, и компания планирует продолжать масштабирование способами, недоступными для старых архитектур. Мы поговорили с Джеффом Виттичем, директором по производству Ampere, об успехах его компании и планах на будущее.

Содержание

1 Иногда мне кажется, что такие стартапы, как Ampere Computing, оказались в затруднительном положении. С одной стороны, существуют многомиллиардные компании, такие как AMD, Nvidia и Intel, а с другой — гипермасштабирующие компании, такие как Microsoft, Google и Amazon, у которых есть свои собственные предложения. Каково быть маленьким млекопитающим в стране динозавров?
2 Ampere уже несколько лет является лидером по количеству ядер на рынке серверных процессоров. Однако другие компании – AMD и Intel – догнали их; Учитывая непреложные законы физики, когда вы, скорее всего, упретесь в стену, когда дело дойдет до физических ядер, и как вы собираетесь ее преодолеть?
3 Еще одна реальная угроза на горизонте — это появление RISC-V, когда Китай поддержит микроархитектуру. Каковы ваши личные взгляды на это? Может ли Ампер однажды присоединиться к команде RISC?
4 Что вы можете рассказать о преемнике Ampere One? Будет ли он идти по тому же пути, что и Altra > One? Больше ядер? Та же частота, больше кэша L2 на ядро? Будет ли он называться Ampere 2 и при этом будет однопоточным?
5 Учитывая целенаправленный подход Ampere Computing, можете ли вы кратко описать, каков ваш средний клиент и с каким типом рабочей нагрузки ему обычно приходится справляться?
6 В этом году искусственный интеллект стал главной темой разговоров в полупроводниковой промышленности и за ее пределами. Как вы думаете, изменится ли это в 2024 году? Каким вы видите этот рынок?
7 Как Ampere реализует эту новую возможность на рынке искусственного интеллекта с помощью своих продуктов?
8 Больше от TechRadar Pro

Иногда мне кажется, что такие стартапы, как Ampere Computing, оказались в затруднительном положении. С одной стороны, существуют многомиллиардные компании, такие как AMD, Nvidia и Intel, а с другой — гипермасштабирующие компании, такие как Microsoft, Google и Amazon, у которых есть свои собственные предложения. Каково быть маленьким млекопитающим в стране динозавров?

Для Ampere это действительно захватывающее время. Возможно, нам всего шесть лет, но, как мы и предсказывали, когда основали компанию, потребность в новом решении для облачных вычислений никогда не была такой острой. Промышленности не нужно больше динозавров – ей нужно что-то новое.

ЧИТАТЬ Праздничное шоу дронов летит прямиком в книгу рекордов | Цифровые тенденции

Требования к облаку изменились. Потребность в вычислительной мощности для современного подключенного мира намного больше, чем кто-либо мог себе представить, и будет только возрастать с появлением искусственного интеллекта. В то же время стоимость энергии резко возросла, спрос в мировых энергосетях превышает предложение, а строительство новых дата-центров останавливается по разным причинам. Сочетание этих факторов создало для Ampere прекрасную возможность предоставить столь необходимое маломощное и высокопроизводительное решение, которое не было предоставлено крупными признанными поставщиками.

Благодаря нашей способности обеспечить это, мы быстро выросли и были приняты почти всеми крупными гиперскейлерами по всему миру. Мы также наблюдаем растущее внедрение корпоративных решений, поскольку компании стремятся максимально эффективно использовать существующее пространство своих центров обработки данных. Продолжающийся рост спроса на продукцию Ampere вселяет в нас уверенность в том, что отрасль признает нашу ценность.

Ampere уже несколько лет является лидером по количеству ядер на рынке серверных процессоров. Однако другие компании – AMD и Intel – догнали их; Учитывая непреложные законы физики, когда вы, скорее всего, упретесь в стену, когда дело дойдет до физических ядер, и как вы собираетесь ее преодолеть?

Как вы упомянули, в течение последних нескольких лет Ampere была лидером в области большого количества ядер, плотной и эффективной вычислительной мощности. Мы заранее поняли, где могут возникнуть самые большие проблемы для роста облака, и сегодня мы решаем эти проблемы с помощью наших процессоров Ampere. Наши процессоры Ampere идеально подходят для всех типов облачных сценариев использования и широкого спектра рабочих нагрузок.

Мы уже несколько раз преодолевали стену масштабирования: сначала мы использовали 128 ядер, а теперь — 192 ядра. Подобные инновации требуют нового подхода, который разрушает старые ограничения. Новый подход Ampere к проектированию процессоров, от микроархитектуры до набора функций, позволит нам продолжать масштабирование способами, недоступными для старых архитектур.

ЧИТАТЬ Google объявляет о том, чтобы повернуть настройку, ремаркетинг и мониторинг конверсии в режиме согласия V2

Еще одна реальная угроза на горизонте — это появление RISC-V, когда Китай поддержит микроархитектуру. Каковы ваши личные взгляды на это? Может ли Ампер однажды присоединиться к команде RISC?

Основная стратегия Ampere заключается в разработке устойчивых процессоров для повышения вычислительной мощности сегодня и в будущем. Мы будем создавать наши процессоры с использованием лучших доступных технологий, чтобы обеспечить высочайшую производительность, эффективность и масштабируемость, при условии, что наши клиенты смогут легко использовать эти технологии для запуска желаемых операционных систем, инфраструктурного программного обеспечения и пользовательских приложений.

Что вы можете рассказать о преемнике Ampere One? Будет ли он идти по тому же пути, что и Altra > One? Больше ядер? Та же частота, больше кэша L2 на ядро? Будет ли он называться Ampere 2 и при этом будет однопоточным?

В течение следующих нескольких лет мы продолжим концентрироваться на выпуске более эффективных процессоров с большим количеством ядер, а также большей пропускной способностью памяти и возможностями ввода-вывода. Это дает нам возможность увеличить пропускную способность для все более важных рабочих нагрузок, таких как создание логических выводов с помощью искусственного интеллекта, и при этом обеспечить уникальное достижение целей устойчивого развития, поставленных поставщиками облачных услуг и пользователями.

Целью наших продуктов по-прежнему является предоставление пользователям облака предсказуемой производительности, устранение проблем с шумными соседями и предоставление поставщикам возможности использовать процессоры Ampere с высокой загрузкой. Мы представим дополнительные функции, которые предоставят облачным провайдерам большую гибкость для удовлетворения разнообразных клиентских приложений. Это критически важно для производительности рабочих нагрузок Cloud Native сейчас и в будущем.

Учитывая целенаправленный подход Ampere Computing, можете ли вы кратко описать, каков ваш средний клиент и с каким типом рабочей нагрузки ему обычно приходится справляться?

Поскольку наши процессоры являются процессорами общего назначения, они охватывают широкий спектр приложений. Мы с самого начала проектировали наши процессоры как облачные процессоры, поэтому они очень хорошо работают практически при любой облачной рабочей нагрузке: логический вывод искусственного интеллекта, веб-сервисы, базы данных и обработка видео — это лишь несколько примеров. Во многих случаях для этих рабочих нагрузок мы можем обеспечить удвоенную производительность при вдвое меньшей мощности традиционных процессоров x86.

Что касается клиентов, то мы работаем практически со всеми крупными гиперскейлерами в США, Европе и Китае. В США вы можете найти экземпляры Ampere в Oracle Cloud, Google Cloud, Microsoft Azure и других сервисах. Процессоры Ampere также доступны по всей Европе от различных облачных провайдеров.

ЧИТАТЬ Нейроколлеги: как использовать ИИ в агентской работе

Помимо крупных поставщиков облачных услуг, мы видим значительную популярность среди предприятий благодаря нашим предложениям от OEM-производителей, таких как HPE и Supermicro. Во многом это связано с повышением эффективности и плотности стоек, которых эти компании могут достичь, используя серверы Ampere. Компании хотят экономить электроэнергию и не строить дополнительные центры обработки данных, которые не являются частью основного бизнеса их компании.

С появлением искусственного интеллекта некогда «простые» устройства становятся умнее, что приводит к увеличению спроса на облачные вычисления в суперлокальных регионах. Эти периферийные развертывания предъявляют строгие требования к пространству и производительности, и, учитывая способность Ampere обеспечивать такое большое количество ядер при низком энергопотреблении, мы также видим высокий спрос на эти рабочие нагрузки.

В этом году искусственный интеллект стал главной темой разговоров в полупроводниковой промышленности и за ее пределами. Как вы думаете, изменится ли это в 2024 году? Каким вы видите этот рынок?

Мы твердо верим, что искусственный интеллект по-прежнему будет главной темой разговоров. Но мы верим, что разговор изменится – и это уже начало.

В 2024 году многие компании, работающие над решениями искусственного интеллекта, перейдут от первоначального обучения нейронных сетей к их развертыванию, также известному как вывод искусственного интеллекта. Поскольку для вывода ИИ в целом может потребоваться в десять раз больше вычислительной мощности, чем для обучения, возможность масштабного развертывания ИИ становится все более важной. Достижение необходимого масштаба будет ограничено производительностью, стоимостью и доступностью, поэтому компании будут искать альтернативы графическим процессорам на следующем этапе. Процессоры, и особенно маломощные и высокопроизводительные процессоры, такие как Ampere, становятся все более привлекательным выбором из-за их способности обеспечивать более эффективное и экономичное выполнение моделей вывода ИИ. Графические процессоры по-прежнему будут важны для определенных аспектов искусственного интеллекта, но мы ожидаем, что шумиха утихнет.

Во-вторых, устойчивость и энергоэффективность, связанные с ИИ, станут еще более важными в следующем году. Сегодня центры обработки данных часто испытывают трудности с удовлетворением своих потребностей в энергии. Растущее использование ИИ приведет к еще большему росту требований к вычислительной мощности в 2024 году, а для некоторых рабочих нагрузок ИИ может потребоваться до 20 раз больше мощности. Таким образом, устойчивость и эффективность становятся проблемами для расширения. Чтобы не поставить под угрозу рост, операторы центров обработки данных будут уделять приоритетное внимание эффективности в новом году.

Как Ampere реализует эту новую возможность на рынке искусственного интеллекта с помощью своих продуктов?

Для многих приложений искусственного интеллекта графические процессоры представляют собой перегрузку вычислительной мощности, потребляя гораздо больше энергии и денег, чем необходимо. Это особенно верно для большинства выводов, особенно когда рабочие нагрузки ИИ выполняются совместно с другими рабочими нагрузками, такими как базы данных или веб-сервисы. В этих случаях замена графического процессора на центральный позволяет сэкономить электроэнергию, пространство и затраты.

Мы уже видим, как это воплощается в жизнь для реальных рабочих нагрузок, и преимущества использования процессоров Ampere огромны. Например, при запуске популярной модели генеративного искусственного интеллекта Whisper на нашем 128-ядерном процессоре Altra по сравнению с графической картой Nvidia A10 мы используем в 3,6 раза меньше энергии на вывод. По сравнению с картами Nvidia Tesla T4 мы используем в 5,6 раза меньше.

Из-за этого мы наблюдаем значительный рост спроса на процессоры Ampere для вывода ИИ и ожидаем, что это превратится в огромный рынок для нашей продукции. Всего несколько недель назад Scaleway – один из ведущих поставщиков облачных услуг в Европе – объявил о предстоящем общедоступном выпуске новых экземпляров вывода ИИ на базе Ampere. Кроме того, за последние шесть месяцев мы наблюдали семикратное увеличение использования нашей библиотеки программного обеспечения для искусственного интеллекта. Все это говорит о растущем признании наших продуктов как высокопроизводительной и маломощной альтернативы искусственному интеллекту.

Больше от TechRadar Pro

Source