Huawei Atlas 350: китайский ИИ-ускоритель для инференса обходит Nvidia H20 в 2,8 раз

22.03.2026

~ 2 мин

Простой

Новости

Введение

Компания Huawei официально анонсировала новый ИИ-ускоритель Atlas 350, предназначенный для задач ИИ-инференса. По данным компании, Huawei Atlas 350 обеспечивает ИИ-производительность, которая в 2,8 раза превосходит ИИ-ускоритель Nvidia H20, который представляет из себя облегченную версию H200 для поставок в Китай. Решение построено на чипе Ascend 950PR и оптимизирован для выполнения такой ресурсоемкой операции, как предварительное заполнение (prefill), от которого зависит время генерации первого токена.

Подробнее о Huawei Atlas 350

ИИ-ускоритель Huawei Atlas 350 базируется на NPU-процессоре Ascend 950PR (преемник чипа Ascend 910C), который производится по 7-нм техпроцессу китайской компании SMIC. Huawei Atlas 350 стал первым китайским решением для ИИ-задач, которое поддерживает передовой формат вычислений FP4, а его ИИ-производительность достигает 1,56 PFLOPS. Также на предыдущей конференции Huawei сообщала, что ускоритель также будет поддерживать FP8 с производительностью до 1 PFLOPS, в то время как предыдущий инференс-ускоритель Huawei Atlas 300I Duo обеспечивал лишь 140 TFLOPS в режиме FP16 и не поддерживал FP8. Производительность нового китайского флагмана в режиме FP8 наиболее приближена к полноценному ускорителю Nvidia H100 в версии SXM5, который обеспечивает 989 TFLOPS. При этом, ИИ-ускоритель для обучения Huawei Ascend 910C имеет большую ИИ-производительность в FP8, которая достигает 1,6 PFLOPS. На ранних слайдах Huawei также было показано, что NPU Ascend 950PR будет поддерживать режимы FP32, FP16/BF16, MXFP8 и MXFP4, но их ИИ-производительность не уточняется. Известно, что Huawei Atlas 350 имеет 112 ГБ памяти HiZQ 1.0 HBM собственной разработки компании, с пропускной способностью в 1,6 ТБ/с, что сопоставимо уровню памяти HBM2 со скоростью 1.55 ТБ/с. Скорее всего, Atlas 350 станет частью ИИ-кластеров Atlas 950, которые вмещают в себя 8192 ИИ-чипов и обеспечивают ИИ-производительность до 8 EFLOPS в режиме FP8.

Характеристики и производительность Huawei Atlas 350

Характеристики и производительность ИИ-ускорителя Atlas 350. Источник: X.

Ключевая особенность ИИ-ускорителей Atlas 350 — оптимизация под фазу предварительного заполнения при инференсе больших языковых моделей. Именно на этом этапе обрабатывается входной запрос, и скорость его выполнения напрямую определяет задержку до начала ответа. Благодаря высокой производительности на этой стадии ускоритель Atlas 350 подходит для ИИ-приложений реального времени и агентных систем.

Huawei Atlas 350 на базе NPU-чипов Ascend 950PR — лишь первое решение большой линейки ИИ-ускорителей Huawei нового поколения. Уже в четвертом квартале 2026 года, компания выпустит новые решения на базе NPU Ascend 950DT для задач обучения искусственного интеллекта на базе обновленной памяти HiZQ 2.0 HBM с улучшенными показателями пропускной способности и увеличенным объемом VRAM.

Сравнение кристаллов Ascend 950PR и Ascend 950DT. Источник: X.

Параллельно Huawei анонсировала масштабное обновление линейки систем хранения данных, включая All-Flash массивы OceanStor Dorado и Pacific 9926, а также платформу FusionCube A1000 для быстрого развёртывания ИИ-инфраструктуры в малом и среднем бизнесе. Юань Юань, президент подразделения хранения данных Huawei, отметил: «Если первая половина эпохи ИИ была сосредоточена на вычислительной мощности, то вторая половина будет определяться данными».

Выводы

Релиз Huawei Atlas 350 и его характеристики говорят о том, что китайский производитель ИИ-решений уже вплотную подобрался к решениям флагманских западных вендоров, таких как Nvidia. Конечно, Huawei Atlas 350 уступает передовым ИИ-ускорителям на архитектуре Blackwell, и уж тем более недавно анонсированным ускорителям Rubin, но для китайских компаний, оказавшихся под санкционными ограничениями, Huawei становится не просто единственной альтернативой, а достойным решением для масштабирования ИИ-инфраструктуры без зависимости от зарубежных поставщиков.

Автор:

Serverflow