Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Визуализация и рендеринг |
| Процессор (CPU) | AMD EPYC |
| Видеокарта (GPU) | NVIDIA RTX PRO 6000 Blackwell |
| Количество GPU, шт | 8 |
| Общий объем видеопамяти (VRAM), ГБ | 768 |
| Тип памяти GPU | GDDR7 |
| Объем оперативной памяти (RAM), ГБ | 1536 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 5U |
Этот сервер в нашей конфигурации ServerFlow рассчитан на тяжёлые AI-нагрузки и стабильный продакшен: сервер отлично подходит для Инференс / Развертывание (Inference), RAG-системы (Retrieval-Augmented Generation), Дообучение моделей (Fine-tuning) и Обучение моделей (Training), а также для Визуализация и рендеринг и Видеоаналитика / Видеонаблюдение.
В основе - NVIDIA RTX PRO 6000 Blackwell Server Edition и суммарно 768 GB VRAM (8×96 GB, GDDR7, ECC). Такой запас памяти даёт комфортный запуск крупных LLM, высокий параллелизм (несколько сервисов/реплик), большой контекст и устойчивую работу с KV-cache. Поддерживаются современные режимы ускорения (включая FP4/FP8/INT8/FP16 в зависимости от пайплайна) и экосистема CUDA для актуальных библиотек и фреймворков.
В сервере 24 DIMM-слота, сейчас задействовано 12, поэтому конфигурация легко расширяется - можно “докинуть” память без замены текущих модулей. Также доступно расширение через M.2.
| Тип точности | Совокупная мощность восьми RTX PRO 6000 BSE |
| FP32 | 960 TFLOPS |
| FP4 | 32 PFLOPS |
| RT Core performance* | 2840 TFLOPS |
*-RT Core performance - это пиковая производительность специализированных RT-ядер (Ray Tracing Cores), которые аппаратно ускоряют операции трассировки лучей (поиск пересечений луча с геометрией и обход BVH). Показатель важен для визуализации/рендеринга и некоторых графических/3D-пайплайнов, но не является прямым аналогом FP32/AI-производительности.
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1 685B | Нет | Примерно 689GB | ✅ | Запускается на одном сервере с 8× RTX PRO 6000 BSE (768GB VRAM) за счёт multi-GPU распределения (tensor/pipeline parallel) через vLLM/TensorRT-LLM; ориентирован на сложные reasoning-сценарии и очень длинный контекст. |
| Qwen3-235B-A22B-Instruct | Нет | Примерно 471GB | ✅ | Отлично масштабируется по 8 GPU в рамках одного узла; подходит для продакшн-чатов, агентов и RAG-систем с высоким QPS и длинными диалогами. |
| Gpt-oss:120b | Нет | Примерно 196GB | ✅ | Комфортно работает в рамках одного сервера: можно держать модель без квантизации и параллельно запускать несколько сервисов/реплик благодаря большому запасу VRAM и пропускной способности Blackwell. |
| GigaChat3-702B-A36B-preview | Нет | Примерно 720GB | ✅ | Помещается на одном узле 8×96GB и запускается в multi-GPU режиме; хорошо для крупных ассистентов, длинного контекста и нескольких одновременных потоков инференса. |
| Mistral-Large-3-675B-Instruct-251 | Нет | Примерно 682GB | ✅ | Оптимальна для аналитических и reasoning-задач в multi-GPU режиме на одном сервере; удобна для RAG и агентных сценариев с большим контекстом. |
| GLM-4.6-FP8 | FP8 | Примерно 361GB | ✅ | FP8-режим эффективно раскрывается на Blackwell; подходит для reasoning-задач, RAG и промышленных LLM-сервисов, снижая требования к памяти и ускоряя инференс. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | Надёжное качество; на 8× RTX PRO 6000 BSE можно параллелить пайплайны, держать большие батчи и стабильную генерацию high-res под CUDA. |
| Flux.2-dev | Текст в изображение | ✅ | Требовательна к памяти: удобно распределять нагрузку по нескольким GPU внутри одного сервера; даёт стабильную high-res генерацию и большие батчи на CUDA-стеке. |
| SD Turbo | Быстрые предпросмотры | ✅ | Максимальная скорость итераций и серийных кадров; можно запускать несколько параллельных задач (в т.ч. через MIG) для онлайн-предпросмотров и прототипирования. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая модель: остаётся большой запас VRAM под высокое разрешение, батчи и одновременную работу нескольких пользователей/пайплайнов на одном узле. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Для коротких роликов: удобно масштабировать по нескольким GPU, ускоряя пакетную генерацию видео и серийных кадров на CUDA. |
| Платформа | Supermicro AS-5126GS-TNRT2 |
| Видеокарта | 8x NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB GDDR7 |
| Процессор | 2x AMD EPYC 9554 (64/128, 3.1GHz-3.75GHz, 360W) |
| Оперативная память | 12x 128GB DDR5 ECC REG Samsung 4800Mhz 4Rx4 |
| SSD накопитель | 4x Solidigm D7-PS1010 1.92TB 2.5" U.2 2x Solidigm D7-P5810 800GB 2.5" U.2 |
| Сетевая карта | 2x NVIDIA MCX713106AS-VEAT (2x QSFP112 200GBE) |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены
* скидка предоставляется при покупке от 30 000 рублей,
в ином случае предусмотрена бесплатная доставка.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим вашу обратную связь.
После покупки оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены.
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.