Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Визуализация и рендеринг |
| Процессор (CPU) | Intel Xeon 6-series |
| Видеокарта (GPU) | NVIDIA RTX PRO 6000 Blackwell |
| Количество GPU, шт | 4 |
| Общий объем видеопамяти (VRAM), ГБ | 384 |
| Тип памяти GPU | GDDR7 |
| Объем оперативной памяти (RAM), ГБ | 1152 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 2U |
GIGABYTE G294-A22-AAP2 с 4× NVIDIA RTX PRO 6000 Blackwell Server Edition (4×96GB) и суммарными 384 GB GDDR7 VRAM - это компактный GPU-узел для Инференс / Развертывание (Inference) и RAG-системы (Retrieval-Augmented Generation), когда нужен высокий throughput и несколько параллельных инстансов моделей в одном сервере.
Blackwell + большой объём VRAM позволяют уверенно держать крупные LLM (в т.ч. MoE) в multi-GPU режиме (tensor/pipeline parallel), а также эффективно обслуживать длинные контексты и много одновременных запросов. Для генеративных задач по изображениям/видео сервер хорошо подходит благодаря запасу памяти и возможности распараллеливания пайплайнов по 4 GPU.
Оптимальные сценарии: Инференс / Развертывание (Inference), RAG-системы (Retrieval-Augmented Generation), Дообучение моделей (Fine-tuning), Анализ данных (Data Science), Визуализация и рендеринг, Видеоаналитика / Видеонаблюдение. Обучение моделей (Training) возможно для средних/части крупных моделей, но эффективность будет зависеть от конкретного стека и схемы параллелизма (и это скорее “практичный on-prem”, а не топовый тренировочный кластер).
| Тип точности | Совокупная мощность четырех RTX PRO 6000 BSE |
| FP32 | 480 TFLOPS |
| FP4 | 16 PFLOPS |
| RT Core performance* | 1420 TFLOPS |
*-RT Core performance - это пиковая производительность специализированных RT-ядер (Ray Tracing Cores), которые аппаратно ускоряют операции трассировки лучей (поиск пересечений луча с геометрией и обход BVH). Показатель важен для визуализации/рендеринга и некоторых графических/3D-пайплайнов, но не является прямым аналогом FP32/AI-производительности.
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1-Distill-Llama-70B | Нет | Примерно 141GB | ✅ | На узле 4× RTX PRO 6000 BSE (384GB VRAM) уверенно запускается в multi-GPU (обычно 2 GPU, при длинном контексте — 4 GPU) через vLLM/TensorRT-LLM. Хорош для reasoning; запас VRAM можно направить на большой KV-cache и высокий QPS при множестве параллельных сессий. |
| Qwen3-235B-A22B-Thinking-2507-FP8 | FP8 | Примерно 236GB | ✅ | Оптимальный формат для «большой модели в одном узле»: FP8 + распределение по 4 GPU оставляют заметный запас под KV-cache, высокий batch и несколько одновременных диалогов. Подходит для агентных сценариев, продакшн-чатов и RAG с высоким QPS. |
| gpt-oss:120b | Нет (FP16) | Примерно 260GB | ✅ | Комфортный “workhorse” для узла 4×96GB: запускается с распределением по 4 GPU, при этом остаётся VRAM под увеличенный контекст и параллельные запросы. Хороший баланс качества и throughput для продакшн-инференса. |
| Mistral-Large-3-675B-Instruct-2512-GGUF | IQ4_XS | Примерно 360GB | ⚠️ | Запуск возможен на 4×96GB, но с минимальным запасом: потребуется жёстко контролировать контекст (KV-cache), batch size и число одновременных сессий. Рекомендуется vLLM/TensorRT-LLM и аккуратная схема tensor/pipeline parallel, чтобы удерживать стабильную латентность. |
| GLM-4.7-FP8 | FP8 | Примерно 362GB | ⚠️ | FP8 снижает требования к памяти и повышает throughput, но модель близка к лимиту узла 384GB. Для стабильной работы нужны умеренный контекст, ограничение параллельных сессий и продакшн-движок (TensorRT-LLM/vLLM) с корректным распределением по 4 GPU. |
| ai-sage_GigaChat3-702B-A36B-preview-GGUF | IQ4_XS | Примерно 376GB | ⚠️ | На 4×96GB работает «впритык» по VRAM: нужен строгий контроль KV-cache/контекста, batch size и количества параллельных диалогов. Рекомендуется запуск через vLLM/TensorRT-LLM с аккуратным tensor/pipeline parallel; подходит для крупных ассистентов, но без большого запаса под высокий QPS. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | На 4× RTX PRO 6000 BSE удобно держать несколько очередей/пользователей и параллельные пайплайны; 96GB на GPU дают большой запас под high-res, крупные batch, refiner и постобработку (апскейл/инпейтинг) без упора в память. |
| Flux.2-dev | Текст в изображение | ✅ | Требовательна к VRAM, но 96GB на GPU позволяют комфортно работать с высоким разрешением и батчами; throughput удобно масштабировать, распределяя задания по нескольким GPU внутри одного сервера для стабильной high-res генерации. |
| SD Turbo | Быстрые предпросмотры | ✅ | Максимальная скорость итераций: на одном узле легко держать много параллельных предпросмотров и серийных кадров, обеспечивая низкую задержку и стабильное обслуживание нескольких потоков одновременно. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая модель: остаётся большой запас VRAM под повышенное разрешение, батчи и одновременную работу нескольких пайплайнов; удобно для многопользовательских сценариев и высокой пропускной способности. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Для коротких роликов удобно распараллеливать генерацию по GPU: сервер ускоряет пакетную обработку, держит несколько очередей и стабильно обслуживает серию задач на CUDA-стеке (видео/серийные кадры). |
| Платформа | GIGABYTE G294-A22-AAP2 |
| Видеокарта | 4x NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB GDDR7 |
| Процессор | 1x Intel Xeon 6944P (72c/144t, 1.8GHz-3.9GHz, 350W) |
| Оперативная память | 12x 96GB DDR5 ECC REG Micron 6400Mhz 2Rx4 |
| SSD накопитель | 6x Samsung PM883a 7.68TB 2.5" 6Gb/s |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены
* скидка предоставляется при покупке от 30 000 рублей,
в ином случае предусмотрена бесплатная доставка.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим вашу обратную связь.
После покупки оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены.
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.