Обзор ИИ-ускорителей Huawei Atlas и Ascend: сравнение моделей для задач искусственного интеллекта
Автор: ServerFlow
Рассказываем о многообразии китайских ИИ-ускорителей Huawei Atlas и Ascend.
Введение
Китайская компания Huawei широко известна на весь мир своими передовыми технологическими решениями, которые включают в себя как бытовую электронику, так и оборудование для вычислительных систем. Пул технологий Huawei настолько велик, что компании удается активно конкурировать с ведущими IT-гигантами во множестве областей, включая выпуск решений для обучения и развертывания передовых LLM — Huawei Atlas и Ascend. В этой статье мы расскажем вам, что из себя представляют решения Atlas и Ascend, расскажем о технических характеристиках всех моделей этих семейств ИИ-ускорителей, а также объясним, какое из решений лучше всего выбрать.
Краткий ликбез
Поскольку лор ИИ-решений Huawei крайне запутан и многообразен, мы решили составить для вас удобную таблицу, в которой отмечено краткое описание всех решений линеек Atlas и Ascend:
Дата выхода
Низкопрофильная плата
Подходит для инференса
Подходит для обучения
Процессор
Huawei Atlas 300i 32 GB LPDDR4X
2019 год
✅
✅
❌
Ascend 310
Huawei Atlas 300I Pro 24 GB LPDDR4X
2021 год
✅
✅
❌
Ascend 310P
Huawei Atlas 300i Duo 96 GB LPDDR4X
2022 год
❌
✅
❌
2x Ascend 310P
Huawei Atlas 300I A2
-
✅
✅
✅
Ascend 310P
Huawei Atlas 300V 24 ГБ LPDDR4X
2022 год
✅
❌
❌
Ascend 310P
Huawei Atlas 300V Pro 48 ГБ LPDDR4X
2021
✅
❌
❌
Ascend 310P
Huawei Atlas 300T 32 GB HBM
2022 год
❌
✅
✅
Ascend 910
Huawei Atlas 300T A2 64 GB HBM2
-
❌
✅
✅
Ascend 910B
Huawei Ascend 910B 32 GB HBM2
2022 год
❌
✅
✅
Ascend 910B
Huawei Ascend 910C HBM2
анонс 2024 год
❌
✅
✅
Ascend 910С
Huawei Ascend 920 HBM3
анонс 2025 год
❌
✅
✅
Ascend 920
Как Huawei позиционирует устройства Atlas и Ascend
Прежде чем говорить о многообразии моделей Atlas и Ascend, стоит объяснить, как компания Huawei продвигает свои решения. Во-первых, Atlas и Ascend — это не типичные профессиональные GPU. Huawei Atlas и Ascend представляют собой ИИ-ускорители, оптимизированные исключительно под задачи искусственного интеллекта и машинного обучения благодаря использованию NPU-чипов Ascend, а не стандартных графических процессоров. На этих устройствах не получится заниматься рендерингом графики, моделированием или запуском видеоигр — только инференс и обучение больших языковых моделей. Стоит отметить, что решения Huawei Atlas и Ascend также отлично справляются с обработкой видеопотока. ИИ-ускорители Atlas и в особенности Ascend используются в частных и государственных вычислительных инфраструктурах Китая, включая дата-центры для разработки новейших китайских LLM и оборонных комплексах КНР. Также устройства Atlas нередко применяются в системах краевых вычислений с интегрированным искусственным интеллектом, например, системах видеонаблюдения или медицинских аппаратах для диагностики.
Несмотря на то, что устройства Huawei Ascend и Atlas в первую очередь предназначены для местного рынка Китая, некоторые модели можно приобрести и за пределами страны. К примеру, PCIe-платы Atlas 300i, 300I Pro и 300V Pro официально поставляются в составе серверов Huawei или как отдельные компоненты через партнеров, а ускорители Ascend 910 B/C не продаются как отдельные модули, а встраиваются в серверы Atlas 800, причем, из-за санкций приобрести их в США и ЕС невозможно.
Huawei очень щепетильно относится к дизайну своих устройств, вследствие чего ИИ-ускорители Huawei Atlas 300 дважды стали победителем премии RedDot — в 2019 и 2023 году. Как отметили жюри, решения компании отличаются симметричной и сбалансированной эстетикой, отражающей стабильность и надежность. Источник: RedDot.
Ускорители инференса ИИ Huawei Atlas
Линейка ускорителей Huawei Atlas — это специализированные решения в виде PCI-e плат для выполнения задач искусственного интеллекта, ориентированные на инференс моделей и обработку данных в реальном времени. В отличие от традиционных GPU от Nvidia с архитектурой CUDA, эти устройства используют уникальную архитектуру процессора для искусственного интеллекта Da Vinci, разработанную Huawei и оптимизированную для матричных операций, тензорных вычислений, что обеспечивает высокую энергоэффективность и производительность при работе с новейшими LLM. Например, модель Atlas 300 поддерживает до 32 TFLOPS (FP16) и анализ 80 каналов 1080p-видео одновременно, при этом имея скромный TDP в 67 Вт, что делает ее идеальной для систем видеонаблюдения и систем умного города.
Более продвинутая версия, Atlas 300I Pro обеспечивает 70 TFLOPS (FP16), а также 80-канальную видеоаналитику. Это решение активно применяется в финансовом секторе для автоматического распознавания документов и анализа страховых случаев, где критически важны скорость обработки и точность. Для масштабных задач, таких как анализ транспортных потоков или распознавание номерных знаков, Huawei предлагает Atlas 300V Pro с поддержкой 64 каналов видео в разрешении 4K.
Сервер Huawei Atlas 800 Inference, в которые интегрируются платы линейки Atlas. Источник: Huawei.
Для краевых вычислений (edge computing) Huawei предлагает компактные решения, такие как Atlas 200, которые встраиваются в камеры или дроны. Эти устройства потребляют всего 8 Вт, но обеспечивают до 16 TOPS (INT8), что делает их пригодными для эффективной работы в системах IoT. Решения Huawei Atlas классифицируются по трем основным сценариям использования — карты для инференса LLM имеют индекс “i”, карты для обработки видео и изображений имеют индекс “V”, а карты для обучения обозначаются индексом “T”.
Huawei Atlas 300I
Ускоритель Huawei Atlas 300i, выпущенный в 2019 году — это специализированное решение для задач искусственного интеллекта и обработки изображений, построенное на уникальной архитектуре Da Vinci 3D Cube. В Huawei Atlas 300i используются матричные процессоры Ascend 310 (16 TOPS), оптимизированные для операций с тензорами и матрицами. ИИ-процессор Huawei Ascend 310 включает аппаратные блоки для квантования данных (INT8/FP16), ускорения трансформеров и декодирования видео (H.265, 4K/60 FPS). Карта оснащена 32 ГБ памяти LPDDR4X с пропускной способностью 204.8 ГБ/с и поддерживает 80-канальную видеоаналитику в реальном времени в разрешении 1080p/25 FPS, что делает ее ключевым элементом систем умного города, промышленного IoT и кибербезопасности. Конечно, весьма устаревший формат памяти на фоне остальных прорывных характеристик PCIe карты смотрится весьма странно, однако, для инференса языковых моделей использование LPDDR4X будет не критичным. Наиболее примечательно, что Huawei Atlas 300i имеет низкопрофильный форм-фактор и при своих габаритах предлагает высочайший уровень производительности — такого сочетания не предлагает ни один из современных GPU от западных производителей. Еще одна особенность Atlas 300i — интеграция с экосистемой MindSpore, включая автоматическую оптимизацию языковых моделей и защиту данных через технологию Secure Boot. Примечательно, что Atlas 300i изначально позиционировалась как решение для инференса и обучения ИИ, однако, в последующих моделях ускорителей Atlas фокус сместился именно на инференс LLM. Энергопотребление не превышает 67 Вт благодаря использованию 12-нм техпроцесса и динамического управления ресурсами, что на 40% эффективнее, чем у ускорителей конкурентов того же ценового сегмента. Стоит отметить, что Huawei Atlas 300i поддерживает операционные системы CentOS и Ubuntu.
PCI-e карта Huawei Atlas 300I имеет компактный форм-фактор, что позволяет интегрировать ее в одноюнитовый сервер.
Характеристика
Huawei Atlas 300i
Дата-выхода
2019 год
Форм-фактор
Низкопрофильная карта расширений
Процессор искусственного Интеллекта
Ascend 310
Формат памяти
32 ГБ LPDDR4X
Общая пропускная способность
204,8 ГБ/с
Поддерживаемые кодеки
H.264, H.265
Интерфейс
PCIe x16 Gen3.0
INT8
88 TOPS
FP16
44 TFLOPS
TDP
67 Вт
Huawei Atlas 300I Pro
Huawei Atlas 300I Pro — это миниатюрная PCIe карта для инференса ИИ 2021 года выпуска, которая является модифицированной версией Huawei Atlas 300i для внутреннего рынка Китая. Поскольку Atlas 300I Pro также является низкопрофильной, ее можно очень удобно интегрировать в серверы без необходимости подключать дополнительное питание. Как и в случае своего предшественника, ускоритель Atlas 300 Pro создан на базе чипов Ascend, но на усовершенствованной версии 310P с архитектурой Da Vinci. Ввиду использования улучшенного ИИ-чипа, Atlas 300 Pro имеет большую производительность в режимах INT8 и FP16. Также Atlas 300I Pro поддерживает новый интерфейс PCIe 4.0, тогда как Atlas 300I поддерживала стандарт PCIe 3.0. Примечательно, что в отличие от стандартной карты Atlas 300I с 32 ГБ памяти LPDDR4X, Pro-версия имеет уменьшенный объем памяти до 24 ГБ LPDDR4X. Это обуславливается специализацией карты, которая предназначена исключительно для инференса искусственного интеллекта, но решение уменьшить объем VRAM все равно очень спорное. Конечно, можно предположить, что в 2021 году еще не существовало ИИ-моделей с колоссальным количеством параметров, как у DeepSeek R1 671b, но в современных реалиях 24 ГБ видеопамяти уже не выглядит конкурентоспособно, а высокая производительность выглядит излишне. PCIe карта Huawei Atlas 300i Pro может справится с такой задачей, как запуск множества сеансов для работы с ИИ благодаря производительности в 70 TFLOPS FP16, однако, такой сценарий использования тоже сомнителен из-за сравнительно небольшого объема памяти. Ввиду всех нововведений, модифицированная ИИ-карта имеет увеличенный TDP до 72 Вт. При этом, Huawei заявляет, что энергоэффективность решения составляет 2 TOPS на 1 Вт, что в 2,1 выше, чем у ИИ-решений линейки Atlas 200, применяемых в промышленном сегменте.
PCI-e карты линейки Huawei Atlas 300 для инференса и анализа видео выглядят идентично друг другу, тогда как модели с индексом “T” и “A2” имеют уникальный дизайн, а Atlas 300i Duo имеют увеличенный, двухслотовый форм-фактор. Источник: Baidu.
Характеристика
Huawei Atlas 300i Pro
Дата-выхода
2021 год
Форм-фактор
Низкопрофильная карта расширений
ИИ-Процессор
Ascend 310P, 8 ядер с частотой 1,9 ГГц
Формат памяти
24 ГБ LPDDR4X
Общая пропускная способность
204,8 ГБ/с
Шина памяти
384-бит
Поддерживаемые кодеки
H.264, H.265
Интерфейс
PCIe x16 Gen4.0
INT8
140 TOPS
FP16
70 TFLOPS
TDP
72 Вт
Huawei Atlas 300I Duo
Huawei Atlas 300i Duo — это однослотовое, полнопрофильное решение для инференса тяжелых моделей ИИ с увеличенным объемом памяти, представленное в 2022 году. Atlas 300i Duo оснащен двумя ИИ-чипами Ascend 310P с суммарным количеством ядер в 16 штук, объем памяти увеличен до 96 ГБ LPDDR4X, а также доступна упрощенная конфигурация с 48 ГБ VRAM. Колоссальный объем памяти в 96 ГБ необходим для возможности развертывания больших языковых моделей с полным числом параметров без применения квантизации, благодаря чему даже в современных реалиях Atlas 300i Duo выглядит вполне конкурентоспособно в сравнении с ускорителями Nvidia H100 и A100. Несмотря на это, стоимость Atlas 300i Duo кратно ниже, чем цены на решения конкурентов, поскольку ускоритель от Huawei оптимизирован только для инференса LLM. Устройство демонстрирует ИИ-производительность до 280 TOPS (INT8) и 140 TFLOPS (FP16), поддерживает гибридные вычисления для задач компьютерного зрения, NLP и видеоаналитики, включая обработку 256 каналов HD-видео (1080p) в режиме реального времени с аппаратным кодированием/декодированием H.265/JPEG. Интеграция с экосистемой Huawei, включая систему Mind Studio и репозитории TensorFlow, PyTorch и ONNX упрощает развертывание языковых моделей в гибридных средах. Основные сценарии использования Atlas 300i Duo включают облачный инференс LLM, умные системы видеонаблюдения, IoT, автономный транспорт и системы безопасности, требующие обработки данных с низкой задержкой и высокой пропускной способностью памяти. Коэффициент энергоэффективности решения составляет 1,86 TOPS на 1 Вт. Используя 6 ускорителей Atlas 300i Duo, вы можете собрать высокопроизводительную и при этом энергоэффективную систему с огромным объемом VRAM для развертывания передовых языковых моделей, таких как DeepSeek R1 671b и llama* 4. На самом деле, Atlas 300i Duo стала по-настоящему народным ИИ-ускорителем в Китае и ее регулярно можно увидеть в обзорах по развертыванию отечественных LLM.
Поскольку Huawei Atlas 300i Duo является стандартной, однослотовой платой расширений, для ее питания используется разъем 8-pin. Также на рендере видно, что решение имеет два интегрированных процессора Ascend 310P. Источник: Baidu.
Характеристика
Huawei Atlas 300i Duo
Дата-выхода
2022 год
Форм-фактор
Однослотовая карта
ИИ-Процессор
2x Ascend 310P, 16 ядер с частотой 1,9 ГГц
Формат памяти
до 96 ГБ LPDDR4X ECC
Общая пропускная способность
408 ГБ/с
Поддерживаемые кодеки
H.264, H.265
Интерфейс
PCIe x16 Gen4.0
INT8
280 TOPS
FP16
140 TFLOPS
TDP
150 Вт
Huawei Atlas 300I A2
Huawei Atlas 300I A2 — это новейшая низкопрофильная карта линейки Atlas 300I, первые упоминания которой появились в январе 2025 года. По всей видимости, это решение является наиболее производительной PCIe картой линейки Atlas 300I, близкое по производительности к решениям Atlas 300T. На сайте Huawei не представлено подробной информации об этих решениях, однако, на сайте компании Quanaichina, которая является дочерней организацией Huawei, указаны некоторые данные о Atlas 300I A2. По всей видимости, новое решение будет предназначено именно для обучения моделей искусственного интеллекта, а не инференса, что нехарактерно для линейки Atlas 300I. Ввиду этого, можно предположить, что Atlas 300I A2 будут иметь память формата HBM и увеличенную производительность в режимах FP16 и INT8. Также известно, что PCIе карта будет иметь двухслотовый форм-фактор, в ней будет использоваться процессор Ascend 310P, а ее TDP будет достигать 350 Вт. Кроме того, максимальное поддерживаемое разрешение Atlas 300I A2 для статичных изображений достигает 16384 x 16384, а для видеоматериалов — 8192 x 8192. Также поддерживается декодирования JPEG в 1080p/12288 FPS, благодаря чему Atlas 300I A2 будут идеальным решением для интеграции в систем видеонаблюдения для распознавания лиц, таких как “умный город”, которые особенно актуальны в Китае ввиду огромного объема населения.
Новейшие видеокарты линейки Huawei Atlas 300I A2. Источник: Quanaichina.
Huawei Atlas 300V
Huawei Atlas 300V — компактная PCIe карта 2022 года выпуска, которая предназначена для эффективной обработки видеопотоков, а также поддерживает различный ИИ-функционал благодаря наличию ИИ-процессора. По сути, карта расширений Huawei Atlas 300V является полным аналогом Atlas 300I Pro, оптимизированным не для инференса ИИ, а для работы с видео и изображениями. По всей видимости, компания Huawei имеет в своем арсенале технологии, которые позволяют удобно менять соотношение ИИ-блоков и блоков обработки видео, от которого и будет зависеть дальнейшая спецификация решений. Ввиду этого Atlas 300V повторяет практически все характеристики оригинальной карты, однако, ИИ-производительность решения, очевидно, снижена ввиду пониженных требований, а количество каналов обработки видео в разрешении 1080p/25FPS расширено до 100. Также поддерживается функция декодирования JPEG 4K 384FPS, а максимальное доступное разрешение — 8192 x 8192. Области применения PCIe карт Huawei Atlas 300V весьма ограничены — данные решения можно эффективно применять в системах умного видеонаблюдения и системах “умный город 2.0”, что обуславливается поддержкой огромного количества видеопотоков.
PCIe карта Huawei Atlas 300V для анализа видеопотока с прозрачной крышкой, через которую видно материнскую плату и процессор устройства. Источник: Baidu.
Характеристика
Huawei Atlas 300V
Дата-выхода
2022 год
Форм-фактор
Низкопрофильная карта расширений
ИИ-Процессор
1x Ascend 310P, 8 ядер
Формат памяти
24 ГБ LPDDR4X ECC
Общая пропускная способность
204,8 ГБ/с
Поддерживаемые кодеки
H.264, H.265
Интерфейс
PCIe x16 Gen4.0
INT8
100 TOPS
FP16
50 TFLOPS
TDP
72 Вт
Huawei Atlas 300V Pro
Huawei Atlas 300V Pro — усовершенствованная плата расширений для видеоанализа Atlas 300V, которая имеет увеличенный объем видеопамяти, улучшенную ИИ-производительность, а также поддерживает обработку до 128 видеопотоков в разрешении 1080p/25FPS в режиме реального времени. Примечательно, что при двукратном увеличении объема видеопамяти, Huawei оставили пропускную способность на уровне 204,8 ГБ/с — возможно, это было сделано во избежание роста тепловыделения, так как он остался на уровне Atlas 300V. В отличие от предыдущей версии карты расширений для обработки видеопотоков, решение Atlas 300V Pro имеет более широкий пул сценариев использования, например, в системах умных финансов, автоматизированного распознавания транспорта, обеспечения безопасности в городской среде и парковых зонах и так далее. Именно для поддержки продвинутых ИИ-функций, таких как распознавание лиц, фиксирование автомобильных номеров, нахождение объектов и распознавание движений, Atlas 300V Pro имеют производительность до 70 TFLOPS в режиме FP16.
Рендер PCIe карты Huawei Atlas 300V Pro для анализа видеопотока в разобранном виде. На изображении также показан NPU-чип Ascend 310P. Источник: Huawei.
Характеристика
Huawei Atlas 300V
Дата-выхода
2021 год
Форм-фактор
Низкопрофильная карта расширений
ИИ-Процессор
1x Ascend 310P, 8 ядер
Формат памяти
48 ГБ LPDDR4X ECC
Общая пропускная способность
204,8 ГБ/с
Поддерживаемые кодеки
H.264, H.265
Интерфейс
PCIe x16 Gen4.0
INT8
140 TOPS
FP16
70 TFLOPS
TDP
72 Вт
Huawei Atlas 300T
Huawei Atlas 300T — это особое ИИ-решение линейки Atlas, которое оптимизировано не для инференса языковых моделей, а для их обучения. Atlas 300T недоступны для отдельной покупки и поставляются только в составе высокопроизводительных серверов для дата-центров корпоративного уровня. В отличие от ускорителей для инференса LLM, Atlas 300T имеет колоссальный уровень производительности до 256 TFLOPS в режиме FP16, что обуславливается интеграцией особого чипа Ascend 910, который состоит, предположительно, из тензорных ядер NPU и вычислительных ядер TaiShan. Поскольку процессор Ascend 910 является самым первым представителем семейства чипов Ascend, в котором Huawei лишь тестировала новые технологии, точное соотношение NPU и CPU ядер неизвестно. Для достижения наиболее эффективного обучения искусственного интеллекта, в решения Atlas 300T интегрирована гибридная память — 32 ГБ HBM и 16 ГБ DDR4, последняя нужна для выполнения вспомогательных задач. Такая конфигурация ядер и памяти объясняется тем, что Ascend 910 изначально предполагался как NPU-процессор, но впоследствии в него интегрировали HBM-память, сделав из него гибрид NPU и GPU.Примечательно, что Huawei Atlas 300T, по сути является первым представителем линейки ИИ-ускорителей Huawei Ascend 910, поскольку последующие поколения этого семейства базируются в корпусе Atlas 300T — в них меняется лишь гибридный чип Ascend. Так как ускорители Atlas 300T позиционируются как решения корпоративного уровня для работы в высокопроизводительных вычислительных кластерах Atlas 900, они имеют сетевой интерфейс 100GE QSFP-DD и поддержкой технологии RoCE. Такой же подход к интеграции сетевых возможностей в ИИ-решений можно встретить в конвергентных ускорителях Nvidia A100X, в которые представляют собой гибрид DPU и GPU. Ввиду двухслотовой конфигурации, карта Huawei Atlas 300T имеет разъем питания 8-pin.
PCI-e карта Huawei Atlas 300T в разобранном виде. Как видно на рендере, на материнской плате ускорителя расположен графический процессор Ascend 910 с HBM-памятью, вокруг которого располагаются чипы памяти DDR4. Источник: Huawei.
Характеристика
Huawei Atlas 300T
Дата-выхода
2022 год
Форм-фактор
Двухслотовая карта расширений
ИИ-Процессор
Ascend 910
Формат памяти
32 ГБ HBM, 16 ГБ DDR4 ECC
Общая пропускная способность
800 ГБ/с
Поддерживаемые кодеки
H.264, H.265
Интерфейс
PCIe x16 Gen4.0
Сетевые возможности
1x порт 100GE QSFP-DD
INT8
-
FP16
256 TFLOPS
TDP
300 Вт
Huawei Atlas 300T A2
Huawei Atlas 300T A2 — это улучшенная конфигурация ускорителя Atlas 300T, которая имеет увеличенные показатели ИИ-производительности, до 2 портов 200GE RoCE v2. В сети практически нет информации о картах расширений Atlas 300T A2, поскольку эти решения пока что не были выпущены компанией Huawei. Также известно, что чипы Atlas 300T A2 поддерживают передовые центральные процессоры Kunpeng 920 с 48 ядрами. Судя по информации, полученной из китайских форумов, Atlas 300T A2 имеет гибридный процессор следующего поколения Ascend 910B, который позднее использовался в одноименных ИИ-ускорителях для обучения ИИ. Стоит отметить, что в отличие от своего предшественника, Atlas 300T A2 поддерживает более современный формат сверхбыстрой памяти HBM2. В данный момент ускорители обучения LLM Atlas 300T A2 еще даже не были анонсированы, однако, на китайских сайтах можно найти ряд сливов, указывающих на анонс новейших ИИ-решений уже в мае 2025 года.
PCI-e плата расширений для обучения ИИ Huawei Atlas 300T A2. Источник: Baidu.
Характеристика
Huawei Atlas 300T A2
Дата-выхода
-
Форм-фактор
Двухслотовая карта расширений
ИИ-Процессор
Ascend 910B, 46 ядер частотой 2,2 ГГц
Формат памяти
64 ГБ HBM2, 16 ГБ DDR4 ECC
Общая пропускная способность
800 ГБ/с
Поддерживаемые кодеки
H.264, H.265
Интерфейс
PCIe x16 Gen5.0
Сетевые возможности
2x порта 200GE RoCE v2
INT8
280 TOPS
FP16
280 TFLOPS
FP32
75 TFLOPS
TDP
330 Вт
Ускорители обучения ИИ Huawei Ascend
Ускорители для обучения ИИ линейки Ascend представляют собой флагманские, высокопроизводительные решения компании Huawei, созданные для конкуренции с топовыми чипами Nvidia. Если первые решения линейки Ascend, такие как модели ускорителей Ascend 910 представляли собой сырое, недоработанное решение с массой недостатков, то новейшие устройства вроде Ascend 910C и 920 вполне способны эффективно конкурировать с западными ИИ-ускорителями, например, H100 и H20.
Сравнение размеров чипов для ИИ-решений Huawei Atlas и Huawei Ascend. Огромной разницей в габаритах процессоров и обуславливается значительный прирост производительности между Ascend 310 и Ascend 910. Источник: Baidu.
В основе их архитектуры лежит использование памяти HBM, что обеспечивает исключительную пропускную способность до 3.2 ТБ/с, а вычислительная мощность достигает 800 TFLOPS в операциях с FP16, что составляет около 80% от возможностей H100. Кроме того, ИИ-ускорители Ascend также базируются на одноименных NPU-чипах на собственной архитектуре Da Vinci, которая также применяется в разработке PCIe плат для инференса ИИ Atlas. ИИ-ускорители Ascend не выпускаются в формате PCI-E, а интегрируются в специализированные серверные системы, например, в серверы Huawei Atlas 800. Последние представляют собой масштабируемые платформы, объединяющие до 32 ускорителей в рамках единого кластера, что позволяет обрабатывать сложные задачи обучения нейросетей и инференса. Важно отметить, что структура проектирования ускорителей Ascend очень напоминает ИИ-решения Nvidia, причем, как по внешнему виду, так и по способу масштабирования — старшие чипы представляют собой несколько младших чипа, соединенных между собой интерконнектом.
Сервер Huawei Atlas 800 Training, в которые интегрируются ИИ-ускорители линейки Ascend. Источник: Huawei.
Серверные стойки, такие как Huawei CloudMatrix 384, также демонстрируют системный подход компании к масштабированию ИИ-инфраструктуры. Эти решения аналогичны Nvidia NVL72 и объединяют до 384 ускорителей Ascend 910C с оптическими соединениями. Для эффективной работы ускорителей, в серверы и кластеры Huawei интегрируются с центральные процессоры Huawei Kunpeng, благодаря чему компании удается создать полностью обособленную экосистему, оптимизированную под задачи машинного обучения. Например, кластеры CloudMatrix 384 распределены по 16 стойкам, где каждая содержит 32 GPU, связанных через высокоскоростные оптические интерфейсы, минимизирующие задержки. Несмотря на более высокое энергопотребление (в 3.9 раза выше, чем у GB200 NVL72), такие системы идеально подходят для рынка Китая, где доступ к дешевой энергии и государственная поддержка ИИ-инфраструктуры компенсируют все недостатки. При этом, Huawei активно развивает программную экосистему, чтобы преодолеть разрыв производительности в сравнении с решениями на архитектуре CUDA, пытаясь полностью импортозаместить западные ИИ-технологии.
Серверный кластер Huawei Atlas 900 AI PoD. Источник: Huawei.
Huawei Ascend 910B
Huawei Ascend 910B — это первые успешные ИИ-ускорители для обучения LLM от Huawei, представленные в 2022 году, которые позиционировались как аналог ускорителей Nvidia A100. Основой ускорителя является одноименный чип Ascend 910B, который производится по техпроцессу 7-нм SMIC (N+1) на усовершенствованной архитектуре New DaVinci, которые, по сравнению с предыдущей версией Ascend 910, предлагают большую энергоэффективность и поддержку современных форматов вычислений, таких как FP16 и INT8. Несмотря на использование менее продвинутого техпроцесса SMIC по сравнению с TSMC (из-за санкций США), Huawei удалось достичь значительного прогресса в увеличении производительности по сравнению с ускорителями Huawei 910, хотя увеличение размера кристалла (до 665.61 мм²) указывает на компромиссы в плотности транзисторов. Помимо этого, в решениях Ascend 910B используется высокоскоростная память формата HBM2 объемом 32 ГБ, что обеспечивает значительный прирост эффективности при обучении нейросетей.
Гибридный процессор Ascend 910B, который используется в одноименных ИИ-ускорителях. Источник: Baidu.
Характеристика
Huawei Ascend 910B
Дата выхода
2022 год
ИИ-Процессор
25 ядер New DaVinci
Формат памяти
HBM2 32 ГБ
Общая пропускная способность
800 ГБ/с
Интерфейс
PCIe 4.0
INT8
640 TOPS
FP16
320 TFLOPS
TDP
310 Вт
Huawei Ascend 910C
Huawei Ascend 910C — передовые ИИ-ускорители, благодаря которым весь мир узнал, что китайская микропроцессорная промышленность может соперничать с передовыми решениями Nvidia. Huawei Ascend 910C, анонсированные в 2024 году, представляет собой два чипа Ascend 910B на 7-нм техпроцессе SMIC, объединенных на одной подложке. Компания Huawei заявляет, что им удалось добиться показателя производительности, которые составляет 60% от ИИ-эффективности решений Nvidia H100. Huawei Ascend 910C все еще не вышли в продажу и о них мало что известно, так как решения предназначены исключительно для местного рынка, однако, первые отгрузки устройств начнутся уже в мае 2025 года и к тому времени можно ожидать появления первых обзоров и подобных характеристик.
ИИ-ускоритель для обучения искусственного интеллекта Huawei Ascend 910C, предположительно, будет состоять из корпуса PCIe карты Huawei Atlas 300T нового поколения и гибридного чипа Ascend 910C, подобно структуре своего предшественника в лице Ascend 910B. Источник: Baidu.
Huawei Ascend 920
Huawei Ascend 920 — это новейшие ИИ-решения Huawei, анонсированные в 2025 году и призванные заменить ускорители Nvidia H20 после ввода торговых ограничений со стороны США. О характеристиках ускорителей Ascend 920 в данный момент практически ничего неизвестно, однако, пользователи предполагают, что производительность решений в режиме FP16 достигнет колоссальных 900 TFLOPS, память обновится до формата HBM3, пропускная способность увеличится до 4 ТБ/с, а сами чипы будут производиться по передовому техпроцессу SMIC 6-нм. Кроме того, модификация 920C, предназначенная для обучения моделей с архитектурой Transformer и Mixture of Experts, по сообщениям инсайдеров, превысит производительность стандартного Ascend 920 примерно на 30–40%. Если упомянутые характеристики подтвердятся, то ускорители Ascend 920 могут действительно стать заменой не только решений H20, но и полноценных ускорителей Nvidia H100, полностью вытеснив западные компании с китайского рынка. Предполагается, что полноценного выхода Huawei Ascend 920 стоит ждать не раньше второй половины 2025 года.
Процессоры для ИИ-ускорителей Huawei Ascend 910 и Nvidia GH100 имеют практически идентичную архитектуру кристалла чипа.
Что же выбрать?
Выбор ИИ-решения от Huawei зависит исключительно от потребностей вашего бизнеса, причем, подобрать наиболее подходящую PCI-e карту или ИИ-ускоритель будет очень удобно благодаря классификации семейств устройств. Если вы хотите приобрести компактное решение с высокой производительностью для инференса языковых моделей, то вам идеально подойдут устройства Atlas 300i. Для обучения более продвинутых LLM и их интеграции в бизнес-приложения могут отлично послужить решения Atlas 300T с высочайшей производительностью и наличием HBM-памяти. В свою очередь, в целях возведения полномасштабных дата-центров для разработки новейших моделей искусственного интеллекта идеальным вариантом станут решения семейства Ascend, которые практически ничем не уступают ИИ-ускорителям от Nvidia при кратно меньшей стоимости.
Вывод
Очевидно, что за последние несколько лет Китай превратился из сильно отстающей в отрасли микропроцессорной промышленности страны в законодателя мод индустрии искусственного интеллекта. А с учетом череды внезапных анонсов ускорителей Ascend 910C и 920, можно с уверенностью заявить, что Китай уже практически вплотную подобрался к уровню производительности, который предлагает компания Nvidia. Если новейшие решения Ascend 910C и 920 после своего выхода действительно предложат производительность и характеристики, которые от них ожидает все мировое сообщество, то Китай не просто выровняется, но и обойдет США в технологической гонке, став мировым лидером в сфере IT-промышленности.
Обзор ИИ-ускорителей Huawei Atlas и Ascend: сравнение моделей для задач искусственного интеллекта
Китайская компания Huawei широко известна на весь мир своими передовыми технологическими решениями, которые включают в себя как бытовую электронику, так и оборудование для вычислительных систем. Пул технологий Huawei настолько велик, что компании удается активно конкурировать с ведущими IT-гигантами во множестве областей, включая выпуск решений для обучения и развертывания передовых LLM — Huawei Atlas и Ascend. В этой статье мы расскажем вам, что из себя представляют решения Atlas и Ascend, расскажем о технических характеристиках всех моделей этих семейств ИИ-ускорителей, а также объясним, какое из решений лучше всего выбрать.
Краткий ликбез
Поскольку лор ИИ-решений Huawei крайне запутан и многообразен, мы решили составить для вас удобную таблицу, в которой отмечено краткое описание всех решений линеек Atlas и Ascend:
Дата выхода
Низкопрофильная плата
Подходит для инференса
Подходит для обучения
Процессор
Huawei Atlas 300i 32 GB LPDDR4X
2019 год
✅
✅
❌
Ascend 310
Huawei Atlas 300I Pro 24 GB LPDDR4X
2021 год
✅
✅
❌
Ascend 310P
Huawei Atlas 300i Duo 96 GB LPDDR4X
2022 год
❌
✅
❌
2x Ascend 310P
Huawei Atlas 300I A2
-
✅
✅
✅
Ascend 310P
Huawei Atlas 300V 24 ГБ LPDDR4X
2022 год
✅
❌
❌
Ascend 310P
Huawei Atlas 300V Pro 48 ГБ LPDDR4X
2021
✅
❌
❌
Ascend 310P
Huawei Atlas 300T 32 GB HBM
2022 год
❌
✅
✅
Ascend 910
Huawei Atlas 300T A2 64 GB HBM2
-
❌
✅
✅
Ascend 910B
Huawei Ascend 910B 32 GB HBM2
2022 год
❌
✅
✅
Ascend 910B
Huawei Ascend 910C HBM2
анонс 2024 год
❌
✅
✅
Ascend 910С
Huawei Ascend 920 HBM3
анонс 2025 год
❌
✅
✅
Ascend 920
Как Huawei позиционирует устройства Atlas и Ascend
Прежде чем говорить о многообразии моделей Atlas и Ascend, стоит объяснить, как компания Huawei продвигает свои решения. Во-первых, Atlas и Ascend — это не типичные профессиональные GPU. Huawei Atlas и Ascend представляют собой ИИ-ускорители, оптимизированные исключительно под задачи искусственного интеллекта и машинного обучения благодаря использованию NPU-чипов Ascend, а не стандартных графических процессоров. На этих устройствах не получится заниматься рендерингом графики, моделированием или запуском видеоигр — только инференс и обучение больших языковых моделей. Стоит отметить, что решения Huawei Atlas и Ascend также отлично справляются с обработкой видеопотока. ИИ-ускорители Atlas и в особенности Ascend используются в частных и государственных вычислительных инфраструктурах Китая, включая дата-центры для разработки новейших китайских LLM и оборонных комплексах КНР. Также устройства Atlas нередко применяются в системах краевых вычислений с интегрированным искусственным интеллектом, например, системах видеонаблюдения или медицинских аппаратах для диагностики.
Несмотря на то, что устройства Huawei Ascend и Atlas в первую очередь предназначены для местного рынка Китая, некоторые модели можно приобрести и за пределами страны. К примеру, PCIe-платы Atlas 300i, 300I Pro и 300V Pro официально поставляются в составе серверов Huawei или как отдельные компоненты через партнеров, а ускорители Ascend 910 B/C не продаются как отдельные модули, а встраиваются в серверы Atlas 800, причем, из-за санкций приобрести их в США и ЕС невозможно.
Huawei очень щепетильно относится к дизайну своих устройств, вследствие чего ИИ-ускорители Huawei Atlas 300 дважды стали победителем премии RedDot — в 2019 и 2023 году. Как отметили жюри, решения компании отличаются симметричной и сбалансированной эстетикой, отражающей стабильность и надежность. Источник: RedDot.
Ускорители инференса ИИ Huawei Atlas
Линейка ускорителей Huawei Atlas — это специализированные решения в виде PCI-e плат для выполнения задач искусственного интеллекта, ориентированные на инференс моделей и обработку данных в реальном времени. В отличие от традиционных GPU от Nvidia с архитектурой CUDA, эти устройства используют уникальную архитектуру процессора для искусственного интеллекта Da Vinci, разработанную Huawei и оптимизированную для матричных операций, тензорных вычислений, что обеспечивает высокую энергоэффективность и производительность при работе с новейшими LLM. Например, модель Atlas 300 поддерживает до 32 TFLOPS (FP16) и анализ 80 каналов 1080p-видео одновременно, при этом имея скромный TDP в 67 Вт, что делает ее идеальной для систем видеонаблюдения и систем умного города.
Более продвинутая версия, Atlas 300I Pro обеспечивает 70 TFLOPS (FP16), а также 80-канальную видеоаналитику. Это решение активно применяется в финансовом секторе для автоматического распознавания документов и анализа страховых случаев, где критически важны скорость обработки и точность. Для масштабных задач, таких как анализ транспортных потоков или распознавание номерных знаков, Huawei предлагает Atlas 300V Pro с поддержкой 64 каналов видео в разрешении 4K.
Сервер Huawei Atlas 800 Inference, в которые интегрируются платы линейки Atlas. Источник: Huawei.
Для краевых вычислений (edge computing) Huawei предлагает компактные решения, такие как Atlas 200, которые встраиваются в камеры или дроны. Эти устройства потребляют всего 8 Вт, но обеспечивают до 16 TOPS (INT8), что делает их пригодными для эффективной работы в системах IoT. Решения Huawei Atlas классифицируются по трем основным сценариям использования — карты для инференса LLM имеют индекс “i”, карты для обработки видео и изображений имеют индекс “V”, а карты для обучения обозначаются индексом “T”.
Huawei Atlas 300I
Ускоритель Huawei Atlas 300i, выпущенный в 2019 году — это специализированное решение для задач искусственного интеллекта и обработки изображений, построенное на уникальной архитектуре Da Vinci 3D Cube. В Huawei Atlas 300i используются матричные процессоры Ascend 310 (16 TOPS), оптимизированные для операций с тензорами и матрицами. ИИ-процессор Huawei Ascend 310 включает аппаратные блоки для квантования данных (INT8/FP16), ускорения трансформеров и декодирования видео (H.265, 4K/60 FPS). Карта оснащена 32 ГБ памяти LPDDR4X с пропускной способностью 204.8 ГБ/с и поддерживает 80-канальную видеоаналитику в реальном времени в разрешении 1080p/25 FPS, что делает ее ключевым элементом систем умного города, промышленного IoT и кибербезопасности. Конечно, весьма устаревший формат памяти на фоне остальных прорывных характеристик PCIe карты смотрится весьма странно, однако, для инференса языковых моделей использование LPDDR4X будет не критичным. Наиболее примечательно, что Huawei Atlas 300i имеет низкопрофильный форм-фактор и при своих габаритах предлагает высочайший уровень производительности — такого сочетания не предлагает ни один из современных GPU от западных производителей. Еще одна особенность Atlas 300i — интеграция с экосистемой MindSpore, включая автоматическую оптимизацию языковых моделей и защиту данных через технологию Secure Boot. Примечательно, что Atlas 300i изначально позиционировалась как решение для инференса и обучения ИИ, однако, в последующих моделях ускорителей Atlas фокус сместился именно на инференс LLM. Энергопотребление не превышает 67 Вт благодаря использованию 12-нм техпроцесса и динамического управления ресурсами, что на 40% эффективнее, чем у ускорителей конкурентов того же ценового сегмента. Стоит отметить, что Huawei Atlas 300i поддерживает операционные системы CentOS и Ubuntu.
PCI-e карта Huawei Atlas 300I имеет компактный форм-фактор, что позволяет интегрировать ее в одноюнитовый сервер.
Характеристика
Huawei Atlas 300i
Дата-выхода
2019 год
Форм-фактор
Низкопрофильная карта расширений
Процессор искусственного Интеллекта
Ascend 310
Формат памяти
32 ГБ LPDDR4X
Общая пропускная способность
204,8 ГБ/с
Поддерживаемые кодеки
H.264, H.265
Интерфейс
PCIe x16 Gen3.0
INT8
88 TOPS
FP16
44 TFLOPS
TDP
67 Вт
Huawei Atlas 300I Pro
Huawei Atlas 300I Pro — это миниатюрная PCIe карта для инференса ИИ 2021 года выпуска, которая является модифицированной версией Huawei Atlas 300i для внутреннего рынка Китая. Поскольку Atlas 300I Pro также является низкопрофильной, ее можно очень удобно интегрировать в серверы без необходимости подключать дополнительное питание. Как и в случае своего предшественника, ускоритель Atlas 300 Pro создан на базе чипов Ascend, но на усовершенствованной версии 310P с архитектурой Da Vinci. Ввиду использования улучшенного ИИ-чипа, Atlas 300 Pro имеет большую производительность в режимах INT8 и FP16. Также Atlas 300I Pro поддерживает новый интерфейс PCIe 4.0, тогда как Atlas 300I поддерживала стандарт PCIe 3.0. Примечательно, что в отличие от стандартной карты Atlas 300I с 32 ГБ памяти LPDDR4X, Pro-версия имеет уменьшенный объем памяти до 24 ГБ LPDDR4X. Это обуславливается специализацией карты, которая предназначена исключительно для инференса искусственного интеллекта, но решение уменьшить объем VRAM все равно очень спорное. Конечно, можно предположить, что в 2021 году еще не существовало ИИ-моделей с колоссальным количеством параметров, как у DeepSeek R1 671b, но в современных реалиях 24 ГБ видеопамяти уже не выглядит конкурентоспособно, а высокая производительность выглядит излишне. PCIe карта Huawei Atlas 300i Pro может справится с такой задачей, как запуск множества сеансов для работы с ИИ благодаря производительности в 70 TFLOPS FP16, однако, такой сценарий использования тоже сомнителен из-за сравнительно небольшого объема памяти. Ввиду всех нововведений, модифицированная ИИ-карта имеет увеличенный TDP до 72 Вт. При этом, Huawei заявляет, что энергоэффективность решения составляет 2 TOPS на 1 Вт, что в 2,1 выше, чем у ИИ-решений линейки Atlas 200, применяемых в промышленном сегменте.
PCI-e карты линейки Huawei Atlas 300 для инференса и анализа видео выглядят идентично друг другу, тогда как модели с индексом “T” и “A2” имеют уникальный дизайн, а Atlas 300i Duo имеют увеличенный, двухслотовый форм-фактор. Источник: Baidu.
Характеристика
Huawei Atlas 300i Pro
Дата-выхода
2021 год
Форм-фактор
Низкопрофильная карта расширений
ИИ-Процессор
Ascend 310P, 8 ядер с частотой 1,9 ГГц
Формат памяти
24 ГБ LPDDR4X
Общая пропускная способность
204,8 ГБ/с
Шина памяти
384-бит
Поддерживаемые кодеки
H.264, H.265
Интерфейс
PCIe x16 Gen4.0
INT8
140 TOPS
FP16
70 TFLOPS
TDP
72 Вт
Huawei Atlas 300I Duo
Huawei Atlas 300i Duo — это однослотовое, полнопрофильное решение для инференса тяжелых моделей ИИ с увеличенным объемом памяти, представленное в 2022 году. Atlas 300i Duo оснащен двумя ИИ-чипами Ascend 310P с суммарным количеством ядер в 16 штук, объем памяти увеличен до 96 ГБ LPDDR4X, а также доступна упрощенная конфигурация с 48 ГБ VRAM. Колоссальный объем памяти в 96 ГБ необходим для возможности развертывания больших языковых моделей с полным числом параметров без применения квантизации, благодаря чему даже в современных реалиях Atlas 300i Duo выглядит вполне конкурентоспособно в сравнении с ускорителями Nvidia H100 и A100. Несмотря на это, стоимость Atlas 300i Duo кратно ниже, чем цены на решения конкурентов, поскольку ускоритель от Huawei оптимизирован только для инференса LLM. Устройство демонстрирует ИИ-производительность до 280 TOPS (INT8) и 140 TFLOPS (FP16), поддерживает гибридные вычисления для задач компьютерного зрения, NLP и видеоаналитики, включая обработку 256 каналов HD-видео (1080p) в режиме реального времени с аппаратным кодированием/декодированием H.265/JPEG. Интеграция с экосистемой Huawei, включая систему Mind Studio и репозитории TensorFlow, PyTorch и ONNX упрощает развертывание языковых моделей в гибридных средах. Основные сценарии использования Atlas 300i Duo включают облачный инференс LLM, умные системы видеонаблюдения, IoT, автономный транспорт и системы безопасности, требующие обработки данных с низкой задержкой и высокой пропускной способностью памяти. Коэффициент энергоэффективности решения составляет 1,86 TOPS на 1 Вт. Используя 6 ускорителей Atlas 300i Duo, вы можете собрать высокопроизводительную и при этом энергоэффективную систему с огромным объемом VRAM для развертывания передовых языковых моделей, таких как DeepSeek R1 671b и llama* 4. На самом деле, Atlas 300i Duo стала по-настоящему народным ИИ-ускорителем в Китае и ее регулярно можно увидеть в обзорах по развертыванию отечественных LLM.
Поскольку Huawei Atlas 300i Duo является стандартной, однослотовой платой расширений, для ее питания используется разъем 8-pin. Также на рендере видно, что решение имеет два интегрированных процессора Ascend 310P. Источник: Baidu.
Характеристика
Huawei Atlas 300i Duo
Дата-выхода
2022 год
Форм-фактор
Однослотовая карта
ИИ-Процессор
2x Ascend 310P, 16 ядер с частотой 1,9 ГГц
Формат памяти
до 96 ГБ LPDDR4X ECC
Общая пропускная способность
408 ГБ/с
Поддерживаемые кодеки
H.264, H.265
Интерфейс
PCIe x16 Gen4.0
INT8
280 TOPS
FP16
140 TFLOPS
TDP
150 Вт
Huawei Atlas 300I A2
Huawei Atlas 300I A2 — это новейшая низкопрофильная карта линейки Atlas 300I, первые упоминания которой появились в январе 2025 года. По всей видимости, это решение является наиболее производительной PCIe картой линейки Atlas 300I, близкое по производительности к решениям Atlas 300T. На сайте Huawei не представлено подробной информации об этих решениях, однако, на сайте компании Quanaichina, которая является дочерней организацией Huawei, указаны некоторые данные о Atlas 300I A2. По всей видимости, новое решение будет предназначено именно для обучения моделей искусственного интеллекта, а не инференса, что нехарактерно для линейки Atlas 300I. Ввиду этого, можно предположить, что Atlas 300I A2 будут иметь память формата HBM и увеличенную производительность в режимах FP16 и INT8. Также известно, что PCIе карта будет иметь двухслотовый форм-фактор, в ней будет использоваться процессор Ascend 310P, а ее TDP будет достигать 350 Вт. Кроме того, максимальное поддерживаемое разрешение Atlas 300I A2 для статичных изображений достигает 16384 x 16384, а для видеоматериалов — 8192 x 8192. Также поддерживается декодирования JPEG в 1080p/12288 FPS, благодаря чему Atlas 300I A2 будут идеальным решением для интеграции в систем видеонаблюдения для распознавания лиц, таких как “умный город”, которые особенно актуальны в Китае ввиду огромного объема населения.
Huawei Atlas 300V — компактная PCIe карта 2022 года выпуска, которая предназначена для эффективной обработки видеопотоков, а также поддерживает различный ИИ-функционал благодаря наличию ИИ-процессора. По сути, карта расширений Huawei Atlas 300V является полным аналогом Atlas 300I Pro, оптимизированным не для инференса ИИ, а для работы с видео и изображениями. По всей видимости, компания Huawei имеет в своем арсенале технологии, которые позволяют удобно менять соотношение ИИ-блоков и блоков обработки видео, от которого и будет зависеть дальнейшая спецификация решений. Ввиду этого Atlas 300V повторяет практически все характеристики оригинальной карты, однако, ИИ-производительность решения, очевидно, снижена ввиду пониженных требований, а количество каналов обработки видео в разрешении 1080p/25FPS расширено до 100. Также поддерживается функция декодирования JPEG 4K 384FPS, а максимальное доступное разрешение — 8192 x 8192. Области применения PCIe карт Huawei Atlas 300V весьма ограничены — данные решения можно эффективно применять в системах умного видеонаблюдения и системах “умный город 2.0”, что обуславливается поддержкой огромного количества видеопотоков.
PCIe карта Huawei Atlas 300V для анализа видеопотока с прозрачной крышкой, через которую видно материнскую плату и процессор устройства. Источник: Baidu.
Характеристика
Huawei Atlas 300V
Дата-выхода
2022 год
Форм-фактор
Низкопрофильная карта расширений
ИИ-Процессор
1x Ascend 310P, 8 ядер
Формат памяти
24 ГБ LPDDR4X ECC
Общая пропускная способность
204,8 ГБ/с
Поддерживаемые кодеки
H.264, H.265
Интерфейс
PCIe x16 Gen4.0
INT8
100 TOPS
FP16
50 TFLOPS
TDP
72 Вт
Huawei Atlas 300V Pro
Huawei Atlas 300V Pro — усовершенствованная плата расширений для видеоанализа Atlas 300V, которая имеет увеличенный объем видеопамяти, улучшенную ИИ-производительность, а также поддерживает обработку до 128 видеопотоков в разрешении 1080p/25FPS в режиме реального времени. Примечательно, что при двукратном увеличении объема видеопамяти, Huawei оставили пропускную способность на уровне 204,8 ГБ/с — возможно, это было сделано во избежание роста тепловыделения, так как он остался на уровне Atlas 300V. В отличие от предыдущей версии карты расширений для обработки видеопотоков, решение Atlas 300V Pro имеет более широкий пул сценариев использования, например, в системах умных финансов, автоматизированного распознавания транспорта, обеспечения безопасности в городской среде и парковых зонах и так далее. Именно для поддержки продвинутых ИИ-функций, таких как распознавание лиц, фиксирование автомобильных номеров, нахождение объектов и распознавание движений, Atlas 300V Pro имеют производительность до 70 TFLOPS в режиме FP16.
Рендер PCIe карты Huawei Atlas 300V Pro для анализа видеопотока в разобранном виде. На изображении также показан NPU-чип Ascend 310P. Источник: Huawei.
Характеристика
Huawei Atlas 300V
Дата-выхода
2021 год
Форм-фактор
Низкопрофильная карта расширений
ИИ-Процессор
1x Ascend 310P, 8 ядер
Формат памяти
48 ГБ LPDDR4X ECC
Общая пропускная способность
204,8 ГБ/с
Поддерживаемые кодеки
H.264, H.265
Интерфейс
PCIe x16 Gen4.0
INT8
140 TOPS
FP16
70 TFLOPS
TDP
72 Вт
Huawei Atlas 300T
Huawei Atlas 300T — это особое ИИ-решение линейки Atlas, которое оптимизировано не для инференса языковых моделей, а для их обучения. Atlas 300T недоступны для отдельной покупки и поставляются только в составе высокопроизводительных серверов для дата-центров корпоративного уровня. В отличие от ускорителей для инференса LLM, Atlas 300T имеет колоссальный уровень производительности до 256 TFLOPS в режиме FP16, что обуславливается интеграцией особого чипа Ascend 910, который состоит, предположительно, из тензорных ядер NPU и вычислительных ядер TaiShan. Поскольку процессор Ascend 910 является самым первым представителем семейства чипов Ascend, в котором Huawei лишь тестировала новые технологии, точное соотношение NPU и CPU ядер неизвестно. Для достижения наиболее эффективного обучения искусственного интеллекта, в решения Atlas 300T интегрирована гибридная память — 32 ГБ HBM и 16 ГБ DDR4, последняя нужна для выполнения вспомогательных задач. Такая конфигурация ядер и памяти объясняется тем, что Ascend 910 изначально предполагался как NPU-процессор, но впоследствии в него интегрировали HBM-память, сделав из него гибрид NPU и GPU.Примечательно, что Huawei Atlas 300T, по сути является первым представителем линейки ИИ-ускорителей Huawei Ascend 910, поскольку последующие поколения этого семейства базируются в корпусе Atlas 300T — в них меняется лишь гибридный чип Ascend. Так как ускорители Atlas 300T позиционируются как решения корпоративного уровня для работы в высокопроизводительных вычислительных кластерах Atlas 900, они имеют сетевой интерфейс 100GE QSFP-DD и поддержкой технологии RoCE. Такой же подход к интеграции сетевых возможностей в ИИ-решений можно встретить в конвергентных ускорителях Nvidia A100X, в которые представляют собой гибрид DPU и GPU. Ввиду двухслотовой конфигурации, карта Huawei Atlas 300T имеет разъем питания 8-pin.
PCI-e карта Huawei Atlas 300T в разобранном виде. Как видно на рендере, на материнской плате ускорителя расположен графический процессор Ascend 910 с HBM-памятью, вокруг которого располагаются чипы памяти DDR4. Источник: Huawei.
Характеристика
Huawei Atlas 300T
Дата-выхода
2022 год
Форм-фактор
Двухслотовая карта расширений
ИИ-Процессор
Ascend 910
Формат памяти
32 ГБ HBM, 16 ГБ DDR4 ECC
Общая пропускная способность
800 ГБ/с
Поддерживаемые кодеки
H.264, H.265
Интерфейс
PCIe x16 Gen4.0
Сетевые возможности
1x порт 100GE QSFP-DD
INT8
-
FP16
256 TFLOPS
TDP
300 Вт
Huawei Atlas 300T A2
Huawei Atlas 300T A2 — это улучшенная конфигурация ускорителя Atlas 300T, которая имеет увеличенные показатели ИИ-производительности, до 2 портов 200GE RoCE v2. В сети практически нет информации о картах расширений Atlas 300T A2, поскольку эти решения пока что не были выпущены компанией Huawei. Также известно, что чипы Atlas 300T A2 поддерживают передовые центральные процессоры Kunpeng 920 с 48 ядрами. Судя по информации, полученной из китайских форумов, Atlas 300T A2 имеет гибридный процессор следующего поколения Ascend 910B, который позднее использовался в одноименных ИИ-ускорителях для обучения ИИ. Стоит отметить, что в отличие от своего предшественника, Atlas 300T A2 поддерживает более современный формат сверхбыстрой памяти HBM2. В данный момент ускорители обучения LLM Atlas 300T A2 еще даже не были анонсированы, однако, на китайских сайтах можно найти ряд сливов, указывающих на анонс новейших ИИ-решений уже в мае 2025 года.
PCI-e плата расширений для обучения ИИ Huawei Atlas 300T A2. Источник: Baidu.
Характеристика
Huawei Atlas 300T A2
Дата-выхода
-
Форм-фактор
Двухслотовая карта расширений
ИИ-Процессор
Ascend 910B, 46 ядер частотой 2,2 ГГц
Формат памяти
64 ГБ HBM2, 16 ГБ DDR4 ECC
Общая пропускная способность
800 ГБ/с
Поддерживаемые кодеки
H.264, H.265
Интерфейс
PCIe x16 Gen5.0
Сетевые возможности
2x порта 200GE RoCE v2
INT8
280 TOPS
FP16
280 TFLOPS
FP32
75 TFLOPS
TDP
330 Вт
Ускорители обучения ИИ Huawei Ascend
Ускорители для обучения ИИ линейки Ascend представляют собой флагманские, высокопроизводительные решения компании Huawei, созданные для конкуренции с топовыми чипами Nvidia. Если первые решения линейки Ascend, такие как модели ускорителей Ascend 910 представляли собой сырое, недоработанное решение с массой недостатков, то новейшие устройства вроде Ascend 910C и 920 вполне способны эффективно конкурировать с западными ИИ-ускорителями, например, H100 и H20.
Сравнение размеров чипов для ИИ-решений Huawei Atlas и Huawei Ascend. Огромной разницей в габаритах процессоров и обуславливается значительный прирост производительности между Ascend 310 и Ascend 910. Источник: Baidu.
В основе их архитектуры лежит использование памяти HBM, что обеспечивает исключительную пропускную способность до 3.2 ТБ/с, а вычислительная мощность достигает 800 TFLOPS в операциях с FP16, что составляет около 80% от возможностей H100. Кроме того, ИИ-ускорители Ascend также базируются на одноименных NPU-чипах на собственной архитектуре Da Vinci, которая также применяется в разработке PCIe плат для инференса ИИ Atlas. ИИ-ускорители Ascend не выпускаются в формате PCI-E, а интегрируются в специализированные серверные системы, например, в серверы Huawei Atlas 800. Последние представляют собой масштабируемые платформы, объединяющие до 32 ускорителей в рамках единого кластера, что позволяет обрабатывать сложные задачи обучения нейросетей и инференса. Важно отметить, что структура проектирования ускорителей Ascend очень напоминает ИИ-решения Nvidia, причем, как по внешнему виду, так и по способу масштабирования — старшие чипы представляют собой несколько младших чипа, соединенных между собой интерконнектом.
Сервер Huawei Atlas 800 Training, в которые интегрируются ИИ-ускорители линейки Ascend. Источник: Huawei.
Серверные стойки, такие как Huawei CloudMatrix 384, также демонстрируют системный подход компании к масштабированию ИИ-инфраструктуры. Эти решения аналогичны Nvidia NVL72 и объединяют до 384 ускорителей Ascend 910C с оптическими соединениями. Для эффективной работы ускорителей, в серверы и кластеры Huawei интегрируются с центральные процессоры Huawei Kunpeng, благодаря чему компании удается создать полностью обособленную экосистему, оптимизированную под задачи машинного обучения. Например, кластеры CloudMatrix 384 распределены по 16 стойкам, где каждая содержит 32 GPU, связанных через высокоскоростные оптические интерфейсы, минимизирующие задержки. Несмотря на более высокое энергопотребление (в 3.9 раза выше, чем у GB200 NVL72), такие системы идеально подходят для рынка Китая, где доступ к дешевой энергии и государственная поддержка ИИ-инфраструктуры компенсируют все недостатки. При этом, Huawei активно развивает программную экосистему, чтобы преодолеть разрыв производительности в сравнении с решениями на архитектуре CUDA, пытаясь полностью импортозаместить западные ИИ-технологии.
Серверный кластер Huawei Atlas 900 AI PoD. Источник: Huawei.
Huawei Ascend 910B
Huawei Ascend 910B — это первые успешные ИИ-ускорители для обучения LLM от Huawei, представленные в 2022 году, которые позиционировались как аналог ускорителей Nvidia A100. Основой ускорителя является одноименный чип Ascend 910B, который производится по техпроцессу 7-нм SMIC (N+1) на усовершенствованной архитектуре New DaVinci, которые, по сравнению с предыдущей версией Ascend 910, предлагают большую энергоэффективность и поддержку современных форматов вычислений, таких как FP16 и INT8. Несмотря на использование менее продвинутого техпроцесса SMIC по сравнению с TSMC (из-за санкций США), Huawei удалось достичь значительного прогресса в увеличении производительности по сравнению с ускорителями Huawei 910, хотя увеличение размера кристалла (до 665.61 мм²) указывает на компромиссы в плотности транзисторов. Помимо этого, в решениях Ascend 910B используется высокоскоростная память формата HBM2 объемом 32 ГБ, что обеспечивает значительный прирост эффективности при обучении нейросетей.
Гибридный процессор Ascend 910B, который используется в одноименных ИИ-ускорителях. Источник: Baidu.
Характеристика
Huawei Ascend 910B
Дата выхода
2022 год
ИИ-Процессор
25 ядер New DaVinci
Формат памяти
HBM2 32 ГБ
Общая пропускная способность
800 ГБ/с
Интерфейс
PCIe 4.0
INT8
640 TOPS
FP16
320 TFLOPS
TDP
310 Вт
Huawei Ascend 910C
Huawei Ascend 910C — передовые ИИ-ускорители, благодаря которым весь мир узнал, что китайская микропроцессорная промышленность может соперничать с передовыми решениями Nvidia. Huawei Ascend 910C, анонсированные в 2024 году, представляет собой два чипа Ascend 910B на 7-нм техпроцессе SMIC, объединенных на одной подложке. Компания Huawei заявляет, что им удалось добиться показателя производительности, которые составляет 60% от ИИ-эффективности решений Nvidia H100. Huawei Ascend 910C все еще не вышли в продажу и о них мало что известно, так как решения предназначены исключительно для местного рынка, однако, первые отгрузки устройств начнутся уже в мае 2025 года и к тому времени можно ожидать появления первых обзоров и подобных характеристик.
ИИ-ускоритель для обучения искусственного интеллекта Huawei Ascend 910C, предположительно, будет состоять из корпуса PCIe карты Huawei Atlas 300T нового поколения и гибридного чипа Ascend 910C, подобно структуре своего предшественника в лице Ascend 910B. Источник: Baidu.
Huawei Ascend 920
Huawei Ascend 920 — это новейшие ИИ-решения Huawei, анонсированные в 2025 году и призванные заменить ускорители Nvidia H20 после ввода торговых ограничений со стороны США. О характеристиках ускорителей Ascend 920 в данный момент практически ничего неизвестно, однако, пользователи предполагают, что производительность решений в режиме FP16 достигнет колоссальных 900 TFLOPS, память обновится до формата HBM3, пропускная способность увеличится до 4 ТБ/с, а сами чипы будут производиться по передовому техпроцессу SMIC 6-нм. Кроме того, модификация 920C, предназначенная для обучения моделей с архитектурой Transformer и Mixture of Experts, по сообщениям инсайдеров, превысит производительность стандартного Ascend 920 примерно на 30–40%. Если упомянутые характеристики подтвердятся, то ускорители Ascend 920 могут действительно стать заменой не только решений H20, но и полноценных ускорителей Nvidia H100, полностью вытеснив западные компании с китайского рынка. Предполагается, что полноценного выхода Huawei Ascend 920 стоит ждать не раньше второй половины 2025 года.
Процессоры для ИИ-ускорителей Huawei Ascend 910 и Nvidia GH100 имеют практически идентичную архитектуру кристалла чипа.
Что же выбрать?
Выбор ИИ-решения от Huawei зависит исключительно от потребностей вашего бизнеса, причем, подобрать наиболее подходящую PCI-e карту или ИИ-ускоритель будет очень удобно благодаря классификации семейств устройств. Если вы хотите приобрести компактное решение с высокой производительностью для инференса языковых моделей, то вам идеально подойдут устройства Atlas 300i. Для обучения более продвинутых LLM и их интеграции в бизнес-приложения могут отлично послужить решения Atlas 300T с высочайшей производительностью и наличием HBM-памяти. В свою очередь, в целях возведения полномасштабных дата-центров для разработки новейших моделей искусственного интеллекта идеальным вариантом станут решения семейства Ascend, которые практически ничем не уступают ИИ-ускорителям от Nvidia при кратно меньшей стоимости.
Вывод
Очевидно, что за последние несколько лет Китай превратился из сильно отстающей в отрасли микропроцессорной промышленности страны в законодателя мод индустрии искусственного интеллекта. А с учетом череды внезапных анонсов ускорителей Ascend 910C и 920, можно с уверенностью заявить, что Китай уже практически вплотную подобрался к уровню производительности, который предлагает компания Nvidia. Если новейшие решения Ascend 910C и 920 после своего выхода действительно предложат производительность и характеристики, которые от них ожидает все мировое сообщество, то Китай не просто выровняется, но и обойдет США в технологической гонке, став мировым лидером в сфере IT-промышленности.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.