Привет, любопытный друг. Да, это Tilda. Потому что мы хотим быстро внедрять и управлять решением, а не ждать
в очереди разработчика. Контроль, предсказуемость и отказоустойчивость — наша главная идея.
Заказать обратный звонок
Оставьте номер телефона — мы свяжемся с вами в ближайшее время, ответим на вопросы и подберём оптимальное решение.
Подберём типовое или произведем на заказ серверное оборудование, предоставим расчёт и поможем интегрировать в систему.
Заполните форму запроса слева или отправьте описание вашей задачи на почту get@work-system.ru
При отправке письма на почту укажите номер телефона вашего специалиста для обсуждения аналогов оборудования в случае необходимости
NVIDIA HGX B300 8-GPU
₽
₽
Запросить
NVIDIA HGX B300 8-GPU — серверная платформа на базе восьми GPU NVIDIA Blackwell Ultra (B300) в форм-факторе SXM. Предназначена для задач генеративного искусственного интеллекта, обучения крупных языковых моделей (LLM), высокопроизводительных вычислений (HPC), научного моделирования, анализа больших данных и глубокого обучения. Платформа обеспечивает производительность до 144 PFLOPS (FP4) и до 72 PFLOPS (FP8), что позволяет ускорять как обучение, так и инференс современных нейросетей с триллионами параметров.
Преимущества модели
– Восемь GPU NVIDIA Blackwell Ultra с суммарным объёмом памяти HBM3e до 2,3 ТБ (288 ГБ на каждый GPU), что обеспечивает работу с моделями сверхбольшого масштаба. – Интерконнект NVLink пятого поколения с пропускной способностью до 1,8 ТБ/с между GPU и общей полосой переключения NVLink Switch до 14,4 ТБ/с. – Встроенные сетевые контроллеры NVIDIA ConnectX-8 SuperNIC непосредственно на базовой плате HGX, обеспечивающие до 800 Гбит/с на порт и поддержку InfiniBand Quantum-X800 и Spectrum-X Ethernet. – Производительность Attention Engine вдвое выше по сравнению с предыдущим поколением HGX B200.
Комплектация
– Базовая плата (baseboard) NVIDIA HGX B300 NVL8 с восемью GPU Blackwell Ultra SXM и двумя чипами NVLink Switch. – Восемь интегрированных сетевых контроллеров ConnectX-8 SuperNIC. – Коннекторы OCP UBB для подключения к серверному шасси. – Система охлаждения: воздушная (с башенными радиаторами) или жидкостная (в зависимости от реализации OEM-партнёра).
Совместимость и монтаж
Платформа устанавливается в серверы форм-фактора 8U (воздушное охлаждение) или 4U/2OU (жидкостное охлаждение). Поддерживает двухсокетные конфигурации на процессорах Intel Xeon 6-го поколения (серии 6700/6500 с P-ядрами, сокет LGA-4710) или AMD EPYC 9005/9004. Предусмотрена интеграция с сетевой инфраструктурой NVIDIA и стойками стандарта ORV3. Доступны решения от Supermicro, ASUS, 2CRSi, Lenovo и других OEM-производителей.
Пропускная способность памяти GPU 8.0 ТБ/с (за GPU)
Кэш L2 192 МБ
Кэш Tensor Memory (TMEM) 256 КБ на SM (40.96 МБ всего)
FP64 (двойная точность) 10 ТФЛОПС (плотность)
FP32 (одинарная точность) 125 ТФЛОПС
FP16/BF16 (полутекущая точность) 2.5 петаФЛОПС (с разреженностью)
FP8 Tensor Core 9 ПФЛОПС (плотность)
FP6 Tensor Core 72 ПФЛОПС (с разреженностью)
NVFP4 (новый формат) 15 ПФЛОПС (плотность), 144 ПФЛОПС (с разреженностью)
INT8 Tensor Core 9 ПОТФС (плотность), 72 ПОТФС (с разреженностью)
TF32 Tensor Core 18 ПФЛОПС
Максимальная частота GPU 2.655 ГГц
Ширина шины памяти 8192 бит (16 × 512-битных каналов)
Максимальная мощность TDP 1400 Вт (за GPU, максимум 1100-1200 Вт стандартно)
NVLink (за GPU) 1.8 ТБ/с (пятое поколение, двусторонний)
NVLink конфигурация 16 NVLink соединений на GPU для полносвязной топологии
Поддержка Transformer Engine Да (второе поколение, FP8/FP6/NVFP4 смешанная точность)
Поддержка спектра структурированной разреженности 2:4 спектр
Динамическое переключение частоты Поддерживается (динамическое масштабирование напряжения и частоты)