Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Визуализация и рендеринг |
| Процессор (CPU) | Intel Xeon |
| Видеокарта (GPU) | NVIDIA RTX PRO 6000 Blackwell |
| Количество GPU, шт | 10 |
| Общий объем видеопамяти (VRAM), ГБ | 960 |
| Тип памяти GPU | GDDR7 |
| Объем оперативной памяти (RAM), ГБ | 384 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 5U |
Это наша сборка в серверной платформе Supermicro SYS-521GE-TNRT - 5U-система, рассчитанная на плотную установку GPU (до 10 штук) и повышенную тепловую нагрузку.
Ключевой акцент - 10× NVIDIA RTX PRO 6000 Blackwell Server Edition по 96 GB GDDR7 каждая (итого 960 GB VRAM): такая конфигурация отлично раскрывается в Инференс / Развертывание (Inference), RAG-системы (Retrieval-Augmented Generation), Дообучение моделей (Fine-tuning) и Обучение моделей (Training), а также в Визуализация и рендеринг и Видеоаналитика / Видеонаблюдение.
GPU построены на архитектуре NVIDIA Blackwell, используют GDDR7 и PCIe Gen5 x16, поддерживают современные тензорные режимы (включая FP8/FP4), а память - с ECC.
| Тип точности | Совокупная мощность десяти RTX PRO 6000 BSE |
| FP32 | 1200 TFLOPS |
| FP4 | 40 PFLOPS |
| RT Core performance* | 3550 TFLOPS |
*-RT Core performance - это пиковая производительность специализированных RT-ядер (Ray Tracing Cores), которые аппаратно ускоряют операции трассировки лучей (поиск пересечений луча с геометрией и обход BVH). Показатель важен для визуализации/рендеринга и некоторых графических/3D-пайплайнов, но не является прямым аналогом FP32/AI-производительности.
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1 685B | Нет | Примерно 689GB | ✅ | Запускается на одном узле нашей сборки (Supermicro SYS-521GE-TNRT, 10× RTX PRO 6000 BSE, 960GB VRAM) без квантизации за счёт multi-GPU распределения (tensor/pipeline parallel) через vLLM/TensorRT-LLM. Большой запас VRAM позволяет держать длинный контекст (KV-cache), повышать batch/QPS и стабильнее обслуживать несколько параллельных потоков инференса. |
| Qwen3-235B-A22B-Instruct | Нет | Примерно 471GB | ✅ | Отлично масштабируется внутри одного сервера: модель распределяется по нескольким GPU (TP/PP), а оставшийся ресурс можно использовать под дополнительные реплики, инструменты/агентов и RAG-обвязку. Хороший выбор для продакшн-чатов с высоким QPS, длинными диалогами и устойчивой латентностью. |
| Gpt-oss:120b | Нет | Примерно 196GB | ✅ | Комфортно работает на одном сервере без квантизации: обычно достаточно части GPU, а остальная VRAM остаётся под параллельные сервисы (несколько инстансов LLM, rerank/эмбеддинги, RAG-индексатор, постпроцессинг). Удобно для сценариев, где важны стабильность и одновременная работа нескольких пайплайнов. |
| GigaChat3-702B-A36B-preview | Нет | Примерно 720GB | ✅ | Помещается в рамках одного узла 10×96GB и запускается в multi-GPU режиме. Запас по общей VRAM полезен для длинного контекста, большего batch size и нескольких одновременных запросов, что особенно важно для больших ассистентов и корпоративных нагрузок. |
| Mistral-Large-3-675B-Instruct-251 | Нет | Примерно 682GB | ✅ | Оптимальна для аналитических и reasoning-сценариев на одном сервере: запуск без квантизации возможен через multi-GPU распределение (vLLM/TensorRT-LLM). Большой запас VRAM помогает держать длинный контекст и параллелить инференс, что удобно для RAG и агентных сценариев. |
| GLM-4.7-FP8 | FP8 | Примерно 362GB | ✅ | FP8-режим эффективно раскрывается на Blackwell: заметно снижает требования к памяти и повышает throughput инференса. На 10×96GB удобно держать FP8-модель с запасом под KV-cache и нагрузку RAG/агентов, добиваясь высокого QPS при стабильной латентности. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | Надёжное качество в продакшене: на 10× RTX PRO 6000 BSE можно параллелить несколько пайплайнов (разные стили/промпты/пользователи), держать большие батчи и стабильно генерировать high-res под CUDA без упора в память. |
| Flux.2-dev | Текст в изображение | ✅ | Требовательна к VRAM, но 96GB на GPU дают комфортный запас: можно запускать высокие разрешения и большие батчи, а также масштабировать обработку по нескольким GPU внутри одного сервера для стабильной high-res генерации и высокой пропускной способности. |
| SD Turbo | Быстрые предпросмотры | ✅ | Максимальная скорость итераций: на одном узле легко держать много параллельных задач предпросмотра и серийных кадров (несколько пользователей/потоков одновременно), сохраняя низкую задержку и стабильную работу. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая модель, отлично подходит для масштабирования по пользователям: остаётся большой запас VRAM под высокое разрешение, батчи и одновременную работу нескольких пайплайнов/очередей на одном сервере. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Для коротких роликов удобно распараллеливать генерацию по GPU: один сервер способен быстро обрабатывать пачки задач, держать несколько очередей и ускорять пакетную генерацию видео/серийных кадров на CUDA-стеке. |
| Платформа | Supermicro SYS-521GE-TNRT |
| Видеокарта | 10x NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB GDDR7 |
| Процессор | 2x Intel Xeon Platinum 8558 (48c/96t, 2.1GHz-4GHz, 330W) |
| Оперативная память | 12x 32GB DDR5 ECC REG Samsung 6400MHz 4Rx4 |
| SSD накопитель | 4x Solidigm D7-PS1010 1.92TB 2.5" U.2 |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены
* скидка предоставляется при покупке от 30 000 рублей,
в ином случае предусмотрена бесплатная доставка.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим вашу обратную связь.
После покупки оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены.
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.