Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) |
| Процессор (CPU) | AMD EPYC |
| Видеокарта (GPU) | NVIDIA A100 |
| Количество GPU, шт | 8 |
| Общий объем видеопамяти (VRAM), ГБ | 640 |
| Тип памяти GPU | HBM2e |
| Объем оперативной памяти (RAM), ГБ | 2000 |
| Тип оперативной памяти | DDR4 ECC REG |
| Форм-фактор | 5U |
NVIDIA DGX с A100 SXM(Ampere) и суммарными 640 GB HBM2e VRAM - это платформа для тяжёлых задач: Обучение моделей (Training), Дообучение моделей (Fine-tuning), Инференс / Развертывание (Inference), RAG-системы (Retrieval-Augmented Generation), HPC / Научные расчёты и Анализ данных (Data Science). Такой объём VRAM позволяет уверенно держать крупные LLM и большие батчи без постоянного “перелива” в CPU RAM.
A100 использует HBM2e и отлично работает в экосистеме CUDA (PyTorch, TensorRT, NCCL, vLLM и др.). Архитектурно это “универсальный ускоритель” для ML/HPC с сильной производительностью в FP16/TF32 и ускорениями для INT8.
Ограничение: это A100, не H100, поэтому нет FP8/FP4-уровня Hopper, и если ваша цель - максимум эффективности на ультранизкой точности, H100 будет быстрее. Также это не “графическая” карта для рендера/видеонаблюдения - фокус именно на вычислениях ML/HPC.
| Тип точности | Совокупная мощность восьми A100 SXM |
| FP64 Tensor Core | 156 TFLOPS |
| BF16 / FP16 Tensor Core | 4 992 TFLOPS |
| TF32 Tensor Core | 2 496 TFLOPS |
| INT8 Tensor Core | 9 984 TOPS |
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1-GGUF 685B | Q4_K_M | Примерно 404GB | ✅ | Силен в рассуждениях; на DGX A100 комфортно держать 4-бит, но при длинном контексте нужен запас под KV-cache и оверхед (лучше использовать tensor parallel на 4–8 GPU и следить за контекстом/батчем). |
| Qwen3.5-397B-A17B-GGUF | Q4_K_M | Примерно 241GB | ✅ | Помещается на DGX A100 целиком; оптимально распараллеливать по 4–8 GPU (TP/PP) для стабильного serving. Подходит для продакшн-чатов и RAG. |
| Gpt-oss:120b | Нет | Примерно 196GB | ✅ | Очень комфортный размер для DGX A100: можно держать на 2–4 GPU, оставляя большой запас под KV-cache, длинные диалоги и высокий throughput (параллельные запросы/батчи). |
| ai-sage_GigaChat3-702B-A36B-preview-GGUF | Q4_K_M | Примерно 472GB | ✅ | На DGX A100 устойчиво запускается в 4-бит; рекомендуется TP на 8 GPU и аккуратные настройки контекста/батча, чтобы сохранить запас VRAM под KV-cache и избежать упора в память при пиковых нагрузках. |
| Mistral-Large-3-675B-Instruct-2512-GGUF | Q4_K_M | Примерно 407GB | ✅ | Оптимальна для аналитики и reasoning; на DGX A100 логично держать 4-бит с запасом под KV-cache (особенно при длинном контексте). Хорошо масштабируется по 4–8 GPU в vLLM/TensorRT-LLM. |
| GLM-5-GGUF | Q4_K_M | Примерно 456GB | ✅ | Стабильный продакшн-запуск на 2–4 GPU; в 4-бит остаётся хороший запас по VRAM под длинный контекст, параллельные запросы и увеличение batch size без риска |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | Надёжное качество и много готовых пайплайнов/оптимизаций. На DGX A100 легко держит высокие разрешения и параллельные очереди; можно масштабировать генерацию по нескольким GPU для максимального throughput. |
| Flux.2-dev | Текст в изображение | ✅ | Требовательная модель: при ~178GB VRAM оптимально запускать в multi-GPU режиме (распараллеливание) или с оптимизациями памяти. На DGX A100 это решаемо и остаётся запас под батчи/разрешение, но итог зависит от конкретного пайплайна. |
| SD Turbo | Быстрые предпросмотры | ✅ | Максимальная скорость для итераций и серийных кадров; отлично подходит для параллельной генерации и больших очередей. На A100 можно держать высокий concurrency без упора в VRAM. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая версия Kandinsky 5.0; требует ~35GB VRAM — на DGX A100 большой запас под повышенное разрешение, батчи и одновременную работу нескольких пайплайнов. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | T2V (~29GB VRAM) для роликов до ~5 секунд; хорошо масштабируется по нескольким GPU (параллельные задачи/очереди) и подходит для продакшн-пайплайнов генерации видео. |
| Видеокарта | 8x Nvidia A100 SXM 80GB HBM2e |
| Процессор | 2x AMD EPYC 7742 (64c/128t, 2.25GHz-3.4GHz, 225W) |
| Оперативная память | 2TB DDR4 ECC REG |
| SSD накопители | 2x 1.92TB NVMe M.2
8x 3.84TB NVMe U.2 |
| Сетевые карты | 8x один порт QSFP112 NVIDIA ConnectX-7 200Gbe InfiniBand
2x два порта QSFP112 10/25/50/100/200Gbe NVIDIA ConnectX-7 VPI |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Поделитесь впечатлением о работе ServerFlow после получения заказа.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.