Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Визуализация и рендеринг |
| Процессор (CPU) | AMD EPYC |
| Видеокарта (GPU) | NVIDIA RTX PRO 6000 Blackwell |
| Количество GPU, шт | 8 |
| Общий объем видеопамяти (VRAM), ГБ | 768 |
| Тип памяти GPU | GDDR7 |
| Объем оперативной памяти (RAM), ГБ | 768 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 4U |
Этот сервер - высокоплотная 4U-платформа под 8 GPU для Инференс / Развертывание (Inference) и RAG-системы (Retrieval-Augmented Generation): можно держать несколько крупных LLM одновременно, обслуживать много пользователей/проектов и масштабировать скорость за счёт параллелизма по GPU.
Каждая NVIDIA RTX PRO 6000 Blackwell Server Edition имеет 96 GB GDDR7 (ECC) и рассчитана на дата-центр: PCIe Gen5, пассивное охлаждение, поддержка FP4 (ускорение LLM-инференса на Tensor Cores), а также мощные видео-движки NVENC/NVDEC - полезно для Видеоаналитика / Видеонаблюдение и мультимодальных пайплайнов.
Суммарно у вас 768 GB VRAM (8 × 96 GB GDDR7) - это уровень, где комфортно живут “очень большие” модели в квантизации и тяжёлые генеративные/видео-задачи. Важно: в этой платформе видеовыходы GPU недоступны, а для 600W GPU требуется соответствующая вентиляция/опциональный fan kit и серьёзный запас по питанию.
| Тип точности | Совокупная мощность восьми RTX PRO 6000 BSE |
| FP32 | 960 TFLOPS |
| FP4 | 32 PFLOPS |
| RT Core performance* | 2840 TFLOPS |
*-RT Core performance - это пиковая производительность специализированных RT-ядер (Ray Tracing Cores), которые аппаратно ускоряют операции трассировки лучей (поиск пересечений луча с геометрией и обход BVH). Показатель важен для визуализации/рендеринга и некоторых графических/3D-пайплайнов, но не является прямым аналогом FP32/AI-производительности.
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1 685B | Нет | Примерно 689GB | ✅ | Запуск на одном узле 8× RTX PRO 6000 BSE (768GB VRAM) через multi-GPU распределение (tensor/pipeline parallel) в vLLM или TensorRT-LLM; сильна в reasoning, хорошо держит длинный контекст и сложные многошаговые цепочки. |
| Qwen3-235B-A22B-Instruct | Нет | Примерно 471GB | ✅ | Комфортно масштабируется по 8 GPU внутри одного сервера; оптимальный кандидат для продакшн-чатов, агентных сценариев и RAG с высоким QPS, длинными диалогами и несколькими параллельными сессиями. |
| Gpt-oss:120b | Нет | Примерно 196GB | ✅ | Работает «в полный рост» на одном сервере без квантизации; запас VRAM позволяет держать увеличенный контекст, высокий batch и запускать несколько реплик/микросервисов параллельно под продакшн-нагрузку. |
| GigaChat3-702B-A36B-preview | Нет | Примерно 720GB | ✅ | Помещается на 8×96GB с multi-GPU (tensor/pipeline parallel); подходит для крупных ассистентов и RAG с длинным контекстом, а также для нескольких одновременных потоков инференса в одном узле. |
| Mistral-Large-3-675B-Instruct-251 | Нет | Примерно 682GB | ✅ | Рациональный выбор для аналитики и reasoning при запуске на 8 GPU; удобна для агентных пайплайнов и RAG, где важны длинные промпты/контекст и стабильный throughput. |
| GLM-4.7-FP8 | FP8 | Примерно 362GB | ✅ | FP8-режим особенно эффективен на Blackwell: ниже требования к памяти при высокой скорости; хорошо подходит для промышленных LLM-сервисов, reasoning и RAG, когда важны throughput и стоимость запроса. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | Стабильная «рабочая лошадка» для продакшна: на 8× RTX PRO 6000 BSE удобно параллелить пайплайны, держать большие батчи и high-res генерацию с предсказуемым качеством на CUDA. |
| Flux.2-dev | Текст в изображение | ✅ | Требовательна к VRAM и пропускной способности: лучше раскрывается при распределении очереди по нескольким GPU; даёт уверенную high-res генерацию и крупные батчи, удобна для массового контента. |
| SD Turbo | Быстрые предпросмотры | ✅ | Максимальная скорость итераций: можно запускать много параллельных задач (включая изоляцию через MIG, если включено) для онлайн-предпросмотров, A/B-прототипирования и серийной генерации кадров. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая и быстрая: остаётся большой запас VRAM под высокие разрешения, апскейл, батчи и одновременную работу нескольких пользователей/пайплайнов на одном узле. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Для коротких роликов и серийных кадров: удобно масштабировать по нескольким GPU, ускоряя пакетную генерацию видео и стабилизируя throughput в продакшн-очереди. |
| Платформа | GIGABYTE G494-ZB4-AAP2 |
| Видеокарта | 8x NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB GDDR7 |
| Процессор | 2x AMD EPYC 9655 (96c/192t, 2.6GHz-4.5GHz, 400W) |
| Оперативная память | 12x 64GB DDR5 ECC REG Samsung 5600Mhz 2Rx4 |
| SSD накопитель | 4x Solidigm D7-PS1030 3.2TB 2.5" U.2 |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены
* скидка предоставляется при покупке от 30 000 рублей,
в ином случае предусмотрена бесплатная доставка.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим вашу обратную связь.
После покупки оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены.
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.