- DeepSeek задерживает начало R2 из -за постоянных технических трудностей с восхождением Huawei Chips
- Системы NVIDIA H20 остаются для ИИ
- Alibabas QWEN3 использует задержки от DeepSeek и содержит основные алгоритмы и повышает эффективность и гибкость
Китайский китайский Deepseek, по -видимому, наткнулся на неожиданные задержки в публикации своей последней модели R2 после столкновения с техническими трудностями с Ascend Chips Huawei.
Компания была поощрена китайскими властями взять на себя внутренние процессоры, а не полагаться на системы H20 Nvidia, которые, как правило, считаются зрелыми и надежными.
Несмотря на поддержку инженеров Huawei на месте, DeepSeek не смог пройти успешный учебный курс с чипсами Ascend, и в результате компания была основана на компании Nvidia halpware для обучения при использовании Ascend для задач вывода.
Технические проблемы задерживают разработку R2
Старт R2, первоначально запланированный на май 2025 года, был отложен из -за этих технических препятствий и дольше, чем ожидаемое маркировка данных для обновленного набора данных обучения.
Основатель DeepSeek Liang Wenfeng сообщил о недовольстве прогрессом модели и подчеркнул необходимость дополнительного времени разработки для создания модели, которая может поддерживать конкурентное преимущество DeepSeek.
В то же время, конкуренты, такие как Alibabas QWEN3, смогли использовать эту задержку, поскольку они содержат основные алгоритмы обучения DeepSeek и в то же время повысить эффективность и гибкость и показывают, как быстро могут развиваться экосистемы ИИ, даже если один стартап сражается.
Более широкий прогресс Пекина на самооценку ИИ оказал давление на домашние компании под давлением, чтобы захватить местное оборудование.
На практике, однако, эта стратегия показала пробелы в стабильности, взаимосвязи и зрелости программного обеспечения между чипами Huawei и продуктами Nvidia.
Разработчики продолжают играть решающую роль в проектировании успеха E -Ecosystems -nvidia -Nvidia заявила, что поддержание доступа к китайским разработчикам стратегически важно и предупреждает, что ограничение введения технологии может нанести ущерб экономическим интересам и интересам национальной безопасности.
Китайские компании ИИ теперь должны примирить давление государственного давления с практическими реалиями в разработке и операциях LLMS.
Несмотря на эти неудачи, модель Deepseek R2 все еще может быть опубликована в ближайшие недели.
Модель, вероятно, будет подвергаться воздействию своей производительности по сравнению с конкурентами, которые обучаются более зрелым оборудованию, и предлагает четкий пример напряженности между политическими амбициями, техническими навыками и реальным использованием ИИ.
Над Arstechnica