Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) / Визуализация и рендеринг |
| Процессор (CPU) | Intel Xeon 6-series |
| Видеокарта (GPU) | NVIDIA B300 SXM |
| Количество GPU, шт | 8 |
| Общий объем видеопамяти (VRAM), ГБ | 2304 |
| Тип памяти GPU | HBM3e |
| Объем оперативной памяти (RAM), ГБ | 4096 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 10U |
Конфигурация ориентирована на обучение моделей (Training) и дообучение моделей (Fine-tuning), когда важны масштабирование по 8 GPU, высокая пропускная способность и стабильность под длительной нагрузкой. Также платформа отлично подходит для инференса / развертывания (Inference) и RAG-систем, где решают скорость отклика, параллельные запросы и большой запас видеопамяти под KV-cache.
GPU-профиль B300 - это архитектура Blackwell с поддержкой FP16/FP8/INT8 и HBM3e, поэтому сервер подходит как для тяжелого тренинга, так и для production-serving с высоким throughput. В узле используется NVIDIA HGX B300 NVL8 с полной связностью по NVLink, а суммарный объём VRAM в этой сборке - 2304 GB (2.3 TB), что упрощает работу с крупными моделями и длинным контекстом.
В практических сценариях это означает, что можно держать большие батчи и высокий concurrency, а при росте контекста управлять расходом памяти через лимиты контекста и настройки батчинга, чтобы не упираться в KV-cache в пиковых нагрузках.
Платформа поддерживает 2× Intel Xeon Scalable 6-го поколения (в документации указано до 86 ядер на процессор), память DDR5 RDIMM - 32 слота с частотой до 6400 MT/s и максимальным объёмом до 4 TB. Для накопителей доступны фронтальные конфигурации до 16× E3.S NVMe или до 10× U.2 NVMe, а под загрузочный массив предусмотрен BOSS-N1 - 2× M.2 NVMe (HW RAID 1).
| Тип точности | Совокупная мощность DGX B300 8-GPU |
| FP8/FP6 Tensor core (training) | 72 PFLOPS |
| FP4 Tensor core (inference) | 144 PFLOPS |
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1 685B | Нет | Примерно 689GB | ✅ | Оптимально распределять на 8 GPU - остаётся большой запас VRAM под длинный контекст и батчи. |
| Qwen3-235B-A22B-Instruct | Нет | Примерно 471GB | ✅ | Удобно масштабировать TP на 2-8 GPU - хороший вариант для продакшн-serving и RAG. |
| Gpt-oss:120b | Нет | Примерно 196GB | ✅ | Комфортно держать на 1-2 GPU, повышая QPS батчами и сохраняя запас под KV-cache. |
| GigaChat3-702B-A36B-preview | Нет | Примерно 720GB | ✅ | Лучше распределять на 8 GPU - стабильный throughput и длинные контексты без дефицита VRAM. |
| Mistral-Large-3-675B-Instruct-251 | Нет | Примерно 682GB | ✅ | Запускается без квантизации на 8 GPU - остаётся запас VRAM под контекст и KV-cache. |
| GLM-4.7 | Нет | Примерно 717GB | ✅ | Стабильный продакшн-запуск на 8 GPU - удобно держать высокий параллелизм запросов. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | Высокие разрешения и большие батчи - очереди легко распараллелить по GPU. |
| Flux.2-dev | Текст в изображение | ✅ | Большой запас VRAM под high-res и крупные батчи - распределение задач по GPU повышает throughput. |
| SD Turbo | Быстрые предпросмотры | ✅ | Максимальный throughput для предпросмотров при высокой параллельности на одном узле. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Несколько пайплайнов одновременно и высокий QPS без упора в видеопамять. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Пакетная генерация коротких роликов - удобно распараллелить по GPU без очередей. |
| Видеокарта | 8x Nvidia B300 SXM 288GB HBM3e |
| Процессор | 2× Intel Xeon 6 серии (до 86 ядер на процессор) |
| Оперативная память | до 4TB DDR5 ECC RDIMM, 32 слота |
| SSD накопители | 16x E3.S Gen5 NVMe direct SSD или 10x U.2 Gen5 NVMe SSD, а под загрузочный массив предусмотрен BOSS-N1 с 2x M.2 SSD |
Если нужна конфигурация на эту платформу под ваши задачи - свяжитесь с менеджером, и мы предложим подходящий вариант под бюджет и требования.
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Поделитесь впечатлением о работе ServerFlow после получения заказа.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.