Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) |
| Процессор (CPU) | Kunpeng 920 |
| Видеокарта (GPU) | Ascend 910B |
| Количество GPU, шт | 8 |
| Общий объем видеопамяти (VRAM), ГБ | 512 |
| Тип памяти GPU | HBM |
| Объем оперативной памяти (RAM), ГБ | 512 |
| Тип оперативной памяти | DDR4 ECC REG |
| Форм-фактор | 4U |
Huawei Atlas 800T A2 - это 4U AI-сервер для Обучения моделей (Training) и Дообучения моделей (Fine-tuning) на базе четырёх процессоров Kunpeng 920 и восьми NPU Ascend 910B. Он рассчитан на разработку и тренинг крупных моделей в областях вроде умных городов, финансов, образования и науки, где требуется высокий объём вычислений и пропускная способность.
Конфигурация с 8×Ascend 910B (по 64 ГБ HBM на NPU) даёт до 512 ГБ ускоренной памяти и суммарную производительность до 3,0 PFLOPS в FP16 и 6,0 POPS в INT8, что подходит как для полноценных тренировочных запусков, так и для тяжёлого Инференса / Развертывания (Inference) и RAG-систем (Retrieval-Augmented Generation) на 100B+ LLM. Исследовательские работы показывают использование Atlas 800T A2 с Ascend 910B3 в качестве базовой платформы для обучения и оценки больших языковых моделей и MoE-архитектур.
До 32 слотов DDR4-3200 (16/32/64 ГБ на модуль) позволяют собрать до 2 ТБ системной памяти — этого хватает для больших индексов, KV-кэшей и сложных пайплайнов Анализа данных (Data Science). Гибкое локальное хранилище (варианты сочетаний SATA и NVMe 2.5″) плюс поддержка RAID 0/1/5/6/10/50/60 закрывают сценарии хранения датасетов и чекпоинтов
Восемь портов 200GE QSFP с RoCE и до трёх слотов PCIe 4.0 дают высокую сетевую плотность и возможность расширения под скоростные адаптеры и специализированные карты. Сервер работает в экосистеме Ascend (CANN, MindSpore, torch-npu, lmdeploy, vLLM-Ascend и т.п.), поэтому ориентирован на стек Huawei вместо CUDA/ROCm, но при этом уже активно используется для развёртывания и обучения LLM в продакшн-проектах.
Четыре блока питания по 2,6 кВт с горячей заменой и схемой 2+2, восемь вентиляторных модулей с N+1-резервированием и воздушное охлаждение обеспечивают надёжную работу при длительных тренировках и высоких нагрузках в ЦОД.
| Тип точности | Совокупная мощность восьми Ascend 910B |
| FP32 | 0.792 PFLOPS |
| FP16 | 3.008 PFLOPS |
| INT8 | 6.016 POPS |
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1-GGUF 671B | Q6_K | Примерно 551GB | ✅ | Требует аккуратной раскладки весов и ограничения batch/контекста: на 8×Ascend 910B (512 ГБ HBM) запуск возможен за счёт агрессивной оптимизации и/или offload, подходит для офлайн-инференса и экспериментов. |
| Qwen3-235B-A22B-Thinking-2507 | Нет | Примерно 470GB | ✅ | Оптимальна для reasoning-задач и аналитики на Atlas 800T A2: комфортно размещается в 512 ГБ HBM и масштабируется по всем 8 NPU для снижения латентности и увеличения пропускной способности. |
| gpt-oss-120b | Нет | Примерно 196GB | ✅ | Даёт высокую скорость отклика и стабильность на Ascend 910B; остаётся большой запас HBM для RAG-индексов, длинного контекста и параллельного запуска нескольких инстансов в продакшн-сервисах. |
| GigaChat3-702B-A36B GGUF | Q4_K_M | Примерно 427GB | ✅ | Подходит для сложных русскоязычных ассистентов, аналитики и генерации длинных текстов; на Atlas 800T A2 хорошо работает в Q4_K_M с распределением по 8 Ascend 910B для устойчивого продакшн-инференса. |
| Mistral-Large-3-675B GGUF | Q4_K_M | Примерно 404GB | ✅ | Многоязычная модель для reasoning-задач, RAG-сценариев и интеллектуальных агентов; на Atlas 800T A2 можно как дообучать, так и развёртывать в виде высоконагруженного сервиса. |
| GLM-4.7-GGUF | Q4_K_M | Примерно 216GB | ✅ | Уверенно работает на 8×Ascend 910B и подходит для многоязычных ассистентов, аналитики и производственных LLM-сервисов. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion 3 Medium | Текст в изображение | ✅ | Использует 8×Ascend 910B и большой объём HBM для генерации изображений вплоть до 4096×4096, а также дообучения и кастомизации SD3-сценариев под свои датасеты. |
| FLUX.2-dev | Текст в изображение | ✅ | Ускоренная версия FLUX для 4K-генерации; на Atlas 800T A2 хорошо масштабируется по 8 NPU и подходит как для офлайн-рендеринга, так и для продакшн-сервисов генерации. |
| Stable Video Diffusion 1.1 | Видео(img2vid) | ✅ | Использует Ascend 910B для генерации реалистичных роликов до ~8 секунд в Full HD; для более длинных видео рекомендуется рендер по сегментам и параллельный запуск нескольких задач на кластере Atlas 800T A2. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая версия Kandinsky 5.0 (~35 GB VRAM); на Atlas 800T A2 есть значительный запас HBM для высокого разрешения, крупных батчей и параллельного запуска нескольких генеративных пайплайнов. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | T2V-модель (~29 GB VRAM) для роликов до ~5 секунд; на Atlas 800T A2 хорошо масштабируется по нескольким NPU и подходит для продакшн-пайплайнов генерации короткого видео и тизеров. |
| Видеокарта | 8x Ascend 910B 64GB HBM |
| Процессор | 4x Kunpeng 920 (64c/64t, 2.6Ghz, 180W) |
| Оперативная память | 512GB DDR4 ECC REG возможно увеличить до 2TB |
| Сетевые карты | 8-port 200Gbe QSFP интерфейс прямого выхода, протокол RoCE |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены
* скидка предоставляется при покупке от 30 000 рублей,
в ином случае предусмотрена бесплатная доставка.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим вашу обратную связь.
После покупки оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены.
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.