Компания Huawei официально анонсировала новый ИИ-ускоритель Atlas 350, предназначенный для задач ИИ-инференса. По данным компании, Huawei Atlas 350 обеспечивает ИИ-производительность, которая в 2,8 раза превосходит ИИ-ускоритель Nvidia H20, который представляет из себя облегченную версию H200 для поставок в Китай. Решение построено на чипе Ascend 950PR и оптимизирован для выполнения такой ресурсоемкой операции, как предварительное заполнение (prefill), от которого зависит время генерации первого токена.
Подробнее о Huawei Atlas 350
ИИ-ускоритель Huawei Atlas 350 базируется на NPU-процессоре Ascend 950PR (преемник чипа Ascend 910C), который производится по 7-нм техпроцессу китайской компании SMIC. Huawei Atlas 350 стал первым китайским решением для ИИ-задач, которое поддерживает передовой формат вычислений FP4, а его ИИ-производительность достигает 1,56 PFLOPS. Также на предыдущей конференции Huawei сообщала, что ускоритель также будет поддерживать FP8 с производительностью до 1 PFLOPS, в то время как предыдущий инференс-ускоритель Huawei Atlas 300I Duo обеспечивал лишь 140 TFLOPS в режиме FP16 и не поддерживал FP8. Производительность нового китайского флагмана в режиме FP8 наиболее приближена к полноценному ускорителю Nvidia H100 в версии SXM5, который обеспечивает 989 TFLOPS. При этом, ИИ-ускоритель для обучения Huawei Ascend 910C имеет большую ИИ-производительность в FP8, которая достигает 1,6 PFLOPS. На ранних слайдах Huawei также было показано, что NPU Ascend 950PR будет поддерживать режимы FP32, FP16/BF16, MXFP8 и MXFP4, но их ИИ-производительность не уточняется. Известно, что Huawei Atlas 350 имеет 112 ГБ памяти HiZQ 1.0 HBM собственной разработки компании, с пропускной способностью в 1,6 ТБ/с, что сопоставимо уровню памяти HBM2 со скоростью 1.55 ТБ/с. Скорее всего, Atlas 350 станет частью ИИ-кластеров Atlas 950, которые вмещают в себя 8192 ИИ-чипов и обеспечивают ИИ-производительность до 8 EFLOPS в режиме FP8.
Характеристики и производительность ИИ-ускорителя Atlas 350. Источник: .
Ключевая особенность ИИ-ускорителей Atlas 350 — оптимизация под фазу предварительного заполнения при инференсе больших языковых моделей. Именно на этом этапе обрабатывается входной запрос, и скорость его выполнения напрямую определяет задержку до начала ответа. Благодаря высокой производительности на этой стадии ускоритель Atlas 350 подходит для ИИ-приложений реального времени и агентных систем.
Huawei Atlas 350 на базе NPU-чипов Ascend 950PR — лишь первое решение большой линейки ИИ-ускорителей Huawei нового поколения. Уже в четвертом квартале 2026 года, компания выпустит новые решения на базе NPU Ascend 950DT для задач обучения искусственного интеллекта на базе обновленной памяти HiZQ 2.0 HBM с улучшенными показателями пропускной способности и увеличенным объемом VRAM.
Сравнение кристаллов Ascend 950PR и Ascend 950DT. Источник: .
Параллельно Huawei анонсировала масштабное обновление линейки систем хранения данных, включая All-Flash массивы OceanStor Dorado и Pacific 9926, а также платформу FusionCube A1000 для быстрого развёртывания ИИ-инфраструктуры в малом и среднем бизнесе. Юань Юань, президент подразделения хранения данных Huawei, отметил: «Если первая половина эпохи ИИ была сосредоточена на вычислительной мощности, то вторая половина будет определяться данными».
Выводы
Релиз Huawei Atlas 350 и его характеристики говорят о том, что китайский производитель ИИ-решений уже вплотную подобрался к решениям флагманских западных вендоров, таких как Nvidia. Конечно, Huawei Atlas 350 уступает передовым ИИ-ускорителям на архитектуре Blackwell, и уж тем более недавно анонсированным ускорителям Rubin, но для китайских компаний, оказавшихся под санкционными ограничениями, Huawei становится не просто единственной альтернативой, а достойным решением для масштабирования ИИ-инфраструктуры без зависимости от зарубежных поставщиков.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Скидка 1 500 ₽ или бесплатная доставка - уже сейчас 🔥
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.
При оформлении заказа в ServerFlow вы можете сообщить о намерении оставить отзыв о нашей работе после получения товара.
Нам важно ваше честное мнение. Оно помогает развивать сервис и даёт другим клиентам представление о нашей работе.
Вы можете оставить отзыв на удобной для вас платформе:
Google Maps
2GIS
Яндекс Карты
Как работает акция
Применяя промокод, вы подтверждаете намерение поделиться впечатлением о работе ServerFlow после получения заказа. Мы применяем бонус уже к текущему заказу в знак благодарности за обратную связь.
Условия акции:
скидка 1 500 ₽ при заказе от 30 000 ₽
или бесплатная доставка* при заказе до 30 000 ₽
* Бесплатная доставка заказа осуществляется до ПВЗ СДЭК.