Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Визуализация и рендеринг |
| Процессор (CPU) | AMD EPYC |
| Видеокарта (GPU) | NVIDIA RTX PRO 6000 Blackwell |
| Количество GPU, шт | 4 |
| Общий объем видеопамяти (VRAM), ГБ | 384 |
| Тип памяти GPU | GDDR7 |
| Объем оперативной памяти (RAM), ГБ | 1152 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 2U |
2U GPU-сервер на 2× AMD EPYC 9754 с 4× NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB (суммарно 384GB VRAM), оптимальный для Инференса / Развертывания (Inference), RAG-систем (Retrieval-Augmented Generation), Дообучения моделей (Fine-tuning) и Обучения моделей (Training) в рамках одного узла. Большой объём VRAM позволяет держать крупные модели и длинный контекст, а 1.1TB RAM - эффективно работать с большими датасетами, индексами RAG и кешами.
Blackwell и 96GB на каждую GPU дают запас под высокий QPS: можно масштабировать параллельные диалоги, увеличивать KV-cache и не “резать” контекст. Для продакшна удобно запускать LLM через vLLM/TensorRT-LLM, а для обучения/дообучения - PyTorch + FSDP/DeepSpeed.
Особенность конфигурации - мощная CPU-подсистема EPYC (много ядер/памяти) для ETL, векторных БД и подготовки данных, при этом тяжёлые LLM/диффузия остаются на GPU.
| Тип точности | Совокупная мощность четырех RTX PRO 6000 BSE |
| FP32 | 480 TFLOPS |
| FP4 | 16 PFLOPS |
| RT Core performance* | 1420 TFLOPS |
*-RT Core performance - это пиковая производительность специализированных RT-ядер (Ray Tracing Cores), которые аппаратно ускоряют операции трассировки лучей (поиск пересечений луча с геометрией и обход BVH). Показатель важен для визуализации/рендеринга и некоторых графических/3D-пайплайнов, но не является прямым аналогом FP32/AI-производительности.
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1-Distill-Llama-70B | Нет | Примерно 141GB | ✅ | На Z42-AAP2 (4×96GB) уверенно в multi-GPU (2–4 GPU). Запас VRAM - под KV-cache и высокий QPS. |
| Qwen3-235B-A22B-Thinking-2507-FP8 | FP8 | Примерно 236GB | ✅ | FP8 хорошо подходит под 4×96GB: остаётся запас под контекст/батч. Отлично для чата и RAG. |
| gpt-oss:120b | Нет (FP16) | Примерно 260GB | ✅ | Комфортный продакшн-инференс на 4 GPU: можно держать большой контекст и несколько сессий одновременно. |
| Mistral-Large-3-675B-Instruct-2512-GGUF | IQ4_XS | Примерно 360GB | ⚠️ | Запуск возможен, но почти без запаса: ограничьте контекст и параллельность (KV-cache критичен). |
| GLM-4.7-FP8 | FP8 | Примерно 362GB | ⚠️ | Близко к лимиту 384GB: нужен умеренный контекст/KV-cache и ограничение числа одновременных диалогов. |
| ai-sage_GigaChat3-702B-A36B-preview-GGUF | IQ4_XS | Примерно 376GB | ⚠️ | Работа “впритык”: минимальный контекст/батч и немного сессий. Для пилотов - ок, для высокого QPS - нет. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | High-res, refiner, инпейтинг/апскейл без дефицита VRAM; легко параллелить по 4 GPU. |
| Flux.2-dev | Текст в изображение | ✅ | 96GB на GPU - комфорт для high-res и батчей; стабильный throughput при распределении задач по GPU. |
| SD Turbo | Быстрые предпросмотры | ✅ | Максимальная скорость итераций: много параллельных предпросмотров/серийных кадров на одном узле. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая модель: высокий QPS, несколько пайплайнов одновременно; большой запас VRAM под качество. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Удобно параллелить по 4 GPU: пакетная генерация коротких видео/серийных кадров без очередей. |
| Платформа | GIGABYTE G294-S42-AAP2 |
| Видеокарта | 4x NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB GDDR7 |
| Процессор | 2x AMD EPYC 9115 (16c/32t, 2.6GHz-4.1GHz, 155W) |
| Оперативная память | 12x 96GB DDR5 ECC REG Samsung 6400Mhz 2Rx4 |
| SSD накопитель | 4x Intel D5-P5530 1.92TB 2.5" U.2 |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Поделитесь впечатлением о работе ServerFlow после получения заказа.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.