Huawei Atlas 800I A2 (8× Ascend 910B 64GB, 4× Kunpeng 920, RAM 512GB)

Name: Huawei Atlas 800I A2 (8× Ascend 910B 64GB, 4× Kunpeng 920, RAM 512GB)
Brand: Huawei
Price: 19389600 RUB
Availability: PreOrder

Huawei Atlas 800I A2 (8× Ascend 910B 64GB, 4× Kunpeng 920, RAM 512GB) 1

Huawei Atlas 800I A2 (8× Ascend 910B 64GB, 4× Kunpeng 920, RAM 512GB) 2

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

19 389 600 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту

добавить В корзину

Сравнить

Гарантия 1 год с заменой компонентов

Доставка СДЭК и ведущими службами доставки

Тестируем оборудование
перед отправкой

Гарантия 1 год с заменой компонентов

Подробнее

Условия доставки и самовывоза

Подробнее

Помощь в вопросе выбора и совместимости

Подробнее

Характеристики Доставка и оплата Гарантия Отзывы Trade In

Руководство пользователя Huawei Atlas 800I A2.pdf

Тип	Новые
Основная задача	Инференс / RAG-системы / Анализ данных / Научные расчеты (HPC)
Процессор (CPU)	Kunpeng 920
Видеокарта (GPU)	Ascend 910B
Количество GPU, шт	8
Общий объем видеопамяти (VRAM), ГБ	512
Тип памяти GPU	HBM
Объем оперативной памяти (RAM), ГБ	512
Тип оперативной памяти	DDR4 ECC REG
Форм-фактор	4U

Подробные характеристики

Подробное описание

Huawei Atlas 800I A2 - это 4U стоечный inference-сервер на базе четырёх CPU Kunpeng 920 и восьми NPU Ascend 910B Reasoning, рассчитанный на промышленные сценарии Инференса / Развертывания (Inference), RAG-систем (Retrieval-Augmented Generation) и reasoning-моделей в интернет-, финтех- и гос-проектах. Сервер официально позиционируется как inference-платформа для крупных генеративных моделей, развёртываемых в ЦОД и облаках.

В конфигурации с 8 × Ascend 910B Reasoning суммарная мощность достигает 2,24 PFLOPS в FP16 и 4,48 POPS в INT8, при этом каждый NPU Ascend 910B оснащён 64 ГБ HBM - всего до 512 ГБ “GPU-памяти” с пропускной способностью до 1,6 ТБ/с по шине HBM.

Поддержка до 32 модулей DDR4-3200 (16/32/64 ГБ на слот, суммарно до 2 ТБ) позволяет держать большие индексы для RAG-систем, KV-кэши и пайплайны Анализа данных (Data Science), а гибкая корзина локального хранилища (варианты до 10×2.5″ SATA/NVMe с поддержкой RAID 0/1/5/6/10/50/60) закрывает задачи хранения датасетов, снапшотов и чекпоинтов. Восемь 200GE QSFP-портов с RoCE дают плотную сетевую связность для кластеров, а до трёх слотов PCIe 4.0 позволяют добавить сетевые карты или специализированные адаптеры.

Сервер использует программный стек Huawei CANN + MindSpore / Ascend-совместимый PyTorch (torch-npu), а также уже поддерживается vLLM-Ascend для LLM-сервинга на Atlas A2 (Ascend-cann-kernels-910b), куда входит и Atlas 800I A2. Это делает его практичной альтернативой NVIDIA-кластерам для развёртывания современных LLM и reasoning-моделей, но требует ориентации на экосистему Ascend вместо CUDA/ROCm. Ограничения: сервер не предназначен для GPU-графики и классического FP64-ориентированного HPC / Научных расчётов, а перенос части tooling’а (TensorRT, CUDA-ориентированные фреймворки) потребует портирования или использования Ascend-специфичных реализаций.

Производительность GPU

Тип точности	Совокупная мощность восьми Ascend 910B Reasoning
FP32	0.60 PFLOPS
FP16	2.24 PFLOPS
INT8	4.48 POPS

Совместимость с LLM-моделями

Модель	Тип квантизации	Требуется VRAM	Совместимость	Примечание
DeepSeek-R1-GGUF 671B	Q4_K_M	Примерно 404GB	✅	Требует аккуратной раскладки весов и ограничения batch/контекста; на 8×Ascend 910B Reasoning (512ГБ HBM) возможен продакшн-инференс при использовании оптимизированного стека под Ascend.
Qwen3.5-397B-A17B-GGUF	Q4_K_M	Примерно 241 GB	✅	Отлично подходит для reasoning-задач и аналитики; уверенно размещается на 8×Ascend 910B Reasoning и масштабируется по всем NPU для снижения латентности.
gpt-oss-120b	Нет	Примерно 196GB	✅	Даёт высокую скорость отклика на Ascend 910B; остаётся значительный запас HBM для RAG-индексов и одновременного запуска нескольких инстансов в продакшн-сервисах.
GigaChat3-702B-A36B GGUF	Q4_K_M	Примерно 427GB	✅	Подходит для сложных русскоязычных ассистентов, аналитики и генерации длинных текстов; комфортно работает в Q4_K_M на всех 8 NPU Ascend 910B Reasoning.
Mistral-Large-3-675B GGUF	Q4_K_M	Примерно 404GB	✅	Многоязычная модель для reasoning-задач, RAG-сценариев и интеллектуальных агентов; хорошо масштабируется по NPU и подходит для сервисов с длинным контекстом на Atlas 800I A2.
GLM-5-GGUF	Q4_K_M	Примерно 456GB	✅	Уверенно работает на 8×Ascend 910B Reasoning и подходит для многоязычных ассистентов, аналитики и производственных LLM-сервисов.

Совместимость с диффузионными моделями

Модель	Тип	Совместимость	Примечание
Stable Diffusion 3 Medium	Текст в изображение	✅	Использует 8×Ascend 910B Reasoning и большой объём HBM для генерации изображений до 4096×4096 с высокими batch-размерами; подходит для сложных композиций и художественных стилей при наличии сборок под Ascend.
FLUX.2-dev	Текст в изображение	✅	Ускоренная версия FLUX для 4K-генерации; на Atlas 800I A2 хорошо масштабируется по 8 NPU Ascend 910B Reasoning и подходит для потоковой генерации и рендеринга при использовании фреймворков с поддержкой Ascend.
Stable Video Diffusion 1.1	Видео(img2vid)	✅	Использует Ascend 910B Reasoning для генерации роликов до ~8 секунд в Full HD; для длинных видео рекомендуется рендер по сегментам с последующей склейкой и параллельным запуском нескольких задач.
Kandinsky-5.0-T2I-Lite-sft-Diffusers	Текст в изображение	✅	Лёгкая версия Kandinsky 5.0 (~35 GB VRAM); на Atlas 800I A2 есть большой запас HBM для высокого разрешения, крупных батчей и одновременного запуска нескольких диффузионных пайплайнов.
Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers	Текст в видео	✅	T2V-модель (~29 GB VRAM) для роликов до ~5 секунд; на Atlas 800I A2 хорошо масштабируется по нескольким NPU Ascend 910B Reasoning и подходит для продакшн-пайплайнов генерации короткого видео.

Технические характеристики

Видеокарта	8x Ascend 910B Reasoning 64GB HBM
Процессор	4x Kunpeng 920 (64c/64t, 2.6Ghz, 180W)
Оперативная память	512GB DDR4 ECC REG возможно увеличить до 2TB
Сетевые карты	8-port 200Gbe QSFP интерфейс прямого выхода, протокол RoCE

Задать вопрос

Наличие на складах (0 шт.)

Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Москва, 2-я Брестская ул., 39 с4

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Мы отправляем заказы ведущими транспортными компаниями:

CDEK
Деловые линии
ПЭК

Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.

Ориентировочные сроки сборки заказов:

Серверные комплектующие: 1-2 раб. дня.
Серверы: 1-4 раб. дня.
Перемещение между офисами (МСК-СПБ): 1-2 раб. дня.

В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.

Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:

Безналичная оплата по счету (для организаций)
Онлайн оплата банковской картой ЮКасса (SberPay, T-Pay, СБП)

Узнать больше

ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.

Также мы можем предложить расширенный срок гарантийных отношений:

Стандартная гарантия 1 год

входит в стоимость

Расширенная гарантия на 2 года

1 938 960 ₽

Расширенная гарантия на 3 года

2 908 440 ₽

Расширенная гарантия на 4 года

3 877 920 ₽

Расширенная гарантия на 5 лет

4 847 400 ₽

Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.

Подробнее об условиях гарантии ServerFlow

ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.

Почему Trade-in в ServerFlow — это удобно:

Оперативная оценка оборудования. Оператор онлайн чата постарается в течении 30 минут дать оценку оборудованию.
Конструктивный диалог. Если вы не согласны с предложенной стоимостью мы постараемся найти компромисс.
Забор оборудования. После согласования Trade-in мы согласуем курьерскую доставку от двери, а если вам удобно лично посетить наш офис в Москве или Санкт-Петербурге.
Тестирование и подтверждение скидки. Технические инженеры ServerFlow проверяет стабильность вашего оборудования. В случае подтверждения стабильности мы утвердим скидку на оборудование.

Скидка 1 500 ₽ за обратную связь

Поделитесь впечатлением о работе ServerFlow после получения заказа.

* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.

копироватьскопировано

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

19 389 600 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту