- Требования к энергии ИИ могут быть уменьшены крупными чипами с одной кефером
- Исследователи говорят, что они могут преодолеть ограничения графического процессора
- Cerebras и Tesla уже используют эти огромные чипы со специальными системами охлаждения для управления теплом
Инженеры Калифорнийского университета Риверсайд изучают новый подход к аппаратному обеспечению искусственного интеллекта, который может справиться как с производительностью, так и в устойчивости.
В статье, изученной экспертами, которая была опубликована в журнале УстройствоКоманда изучила потенциал ускорителей по шкале пластин — огромные компьютерные чипы, которые не пластины по всему кремнию, а не небольшие чипы, которые используются в сегодняшних графических процессорах.
«Технология масштаба пластин-это большой скачок вперед»,-сказал Михри Озкан, профессор электрических и компьютерных технологий в UCR и старший автор статьи. «Это позволяет моделям ИИ с триллионами параметров быстрее и эффективнее, чем обычные системы».
Как монорельсы
Эти чипы, такие как цереблас-масштабные моторные 3 (WSE-3), которые мы ранее покрывали, содержат до 4 триллионов транзисторов и 900 000 ядер, ориентированных на AI на одной единице. Другой процессор по шкале пластин, Dojo D1, находится 1,25 триллиона транзисторов и почти 9 000 ядер на модуль.
Процессоры удаляют задержки и потери энергии, которые распространены в системах, в которых данные получают между несколькими чипами.
«Удерживая все на пластине, избегайте задержек и потерь электроэнергии посредством передачи чипа к чип»,-сказал Озкан.
Традиционные графические процессоры по -прежнему важны из -за их более низких затрат и модульности, но когда модели искусственного интеллекта растут в размерах и сложности, чипы, производительность и энергетические аранжировки начинают встречаться.
«Компания ИИ больше не является почти скоростью», — сказал Озкан. «Речь идет о разработке систем, которые могут перемещать огромные объемы данных без перегрева или потребления чрезмерного электричества».
Системы по шкале пластин также имеют важные экологические преимущества. Например, WSE-3 церебров может работать до 125 миллиардов операций в секунду, в то время как используется гораздо меньше энергии, чем настройки графических процессоров.
«Представьте себе графические процессоры как оживленные автомагистрали — эффективные, но трафики отпускают энергию», — сказал Озкан. «Двигатели масштаба пластин больше похожи на однородную: прямую, эффективную и менее грязную».
Тем не менее, остается серьезной проблемой — столетия — проблема тепла. Чипы для масштаба пластин могут потреблять до 10000 Вт электроэнергии.
Cerebras использует гликол на основе гликола, встроенный в чип, в то время как Tesla имеет жидкую систему, которая равномерно распределяет охлаждающую жидкость по поверхности чипа.
Над Tech Xplore