Обзор NVIDIA DGX Spark: машина GB10 просто невероятно крутая

Дата публикации: 16 октября 2025

Наш NVIDIA Spark прибыл менее недели назад. Устройство произвело впечатление уже на GTC 2025, но в работе оказалось ещё интереснее, несмотря на отдельные сложности на старте. Это компактная AI-станция на базе NVIDIA с большим объёмом памяти — хорошее решение для разработчиков. Для специалистов, занимающихся внедрением ИИ, Spark может стать обязательным инструментом. По возможностям он уже приближается к формату, который можно рекомендовать даже руководителям, отвечающим за внедрение ИИ в компании. Подробности и оценки — в следующем материале. Но уже сейчас устройство привлекает внимание и вызывает интерес к его возможностям.

Для обзора NVIDIA прислала нам предсерийный экземпляр. Отмечу, что я сразу оформил предварительный заказ на две таких системы с комплектом медных DAC-кабелей, когда устройство только появилось, но до сих пор не получил письмо с подтверждением покупки — поэтому в работе только этот образец. Вчера мы также показывали Dell Pro Max с GB10, но для этого обзора не разрешили включать обе системы одновременно — у неё другой срок снятия эмбарго.

Обзор NVIDIA DGX Spark

Размер Spark трудно оценить по фото — это становится понятно только вживую. Габариты: 150 × 150 × 50,5 мм. Устройство компактное и внешне выделяется среди других. После съёмки можно сказать: «Это самый крутой мини-ПК». На тот момент мы одновременно работали с тремя системами на AMD Strix Halo, двумя GB10 (включая эту), одной Intel-сборкой с PCIe-доком и другими. Мнение оказалось общим — Spark действительно выделяется среди всего оборудования.

На передней панели расположен материал, похожий на поролон, но на самом деле он жёсткий и пропускает воздух для охлаждения.

На нижней части корпуса — крупная вентиляционная решётка и большая резиновая подкладка. Устройство устойчиво стоит на столе.

Боковые панели и верхняя часть корпуса — плоские, без вентиляционных отверстий или элементов управления.

Боковые панели металлические и окрашены в золотистый цвет. Других элементов или функций на них нет.

Все основные элементы находятся на задней панели — здесь расположены кнопка питания и порты ввода-вывода.

Слева сзади расположена кнопка питания, за ней — порт USB Type-C для подачи питания по USB PD. Далее идут три порта USB 3 Type-C с пропускной способностью 20 Гбит/с и поддержкой DisplayPort Alt Mode. Рядом — порт HDMI. Некоторые особенности работы с дисплеями описаны в разделе о начальных сложностях.

Для подключения к сети предусмотрен порт 10GbE на базе Realtek — драйвер уже включён в состав DGX OS, установка не потребовалась. Основная особенность — сетевые адаптеры NVIDIA ConnectX-7.

К этим портам мы ещё вернёмся, но важно отметить: это QSFP56-порты на 200GbE, работающие по четырём каналам по 56G/50 Гбит/с с модуляцией PAM4. Подробности об отличиях между QSFP и QSFP-DD мы уже рассматривали ранее — на высоких скоростях физическое подключение становится нетривиальной задачей. Эти порты — ключевая часть концепции DGX Spark и GB10. Благодаря поддержке RDMA и высокой пропускной способности, устройства можно напрямую соединить через медный DAC-кабель для расширения вычислений и памяти между двумя системами.

Сердце Spark: NVIDIA GB10

Из-за ограниченного времени, желания сохранить систему в рабочем состоянии и наличия уже сделанных фото, мы используем ранее опубликованные изображения. Ниже — плата устройства целиком.

В основе системы — вычислительный модуль NVIDIA GB10 (Grace Blackwell), объединяющий 20-ядерный процессор Arm и графический процессор поколения Blackwell. Связь между ними осуществляется через интерфейс C2C NVLink. По бокам размещены модули памяти LPDDR5X объёмом 128 ГБ.

Позже мы покажем, как реализована единая память. Это важная особенность: система использует общий пул памяти, доступный как для CPU, так и для GPU.

NVIDIA GB10 — совместная разработка с Mediatek. Процессор Arm создан на базе IP Mediatek, а графическая часть — GPU поколения Blackwell от NVIDIA. Они объединены через интерфейс C2C. По концепции это упрощённый вариант более мощных решений Grace Blackwell, но в компактной форме, подходящей для использования в настольных системах и ноутбуках.

Здесь показано, как реализовано соединение между GPU и Arm-процессором внутри SoC с TDP 140 Вт (это только для чипа, не всей системы).

Ниже — основные характеристики: техпроцесс TSMC 3 нм, компоновка в формате 2.5D и другие параметры.

Графический процессор Blackwell оснащён 24 МБ кэш-памяти L2 для графики и обеспечивает суммарную пропускную способность 600 ГБ/с, несмотря на то, что пропускная способность LPDDR5X составляет менее половины этого значения.

Ниже — вывод команды lscpu для 20-ядерного Arm-процессора, установленного в системе.

Ниже приведён вывод команды nvidia-smi для графического процессора NVIDIA Blackwell, установленного в системе.

При взгляде на материнскую плату сразу заметно, что модуль ConnectX-7 занимает значительное пространство. Это по сути адаптер NVIDIA ConnectX-7 OCP NIC 3.0 с двумя портами 200GbE — аналог модели, которую мы уже рассматривали. Даже в б/у состоянии такие сетевые карты стоят от $900 и выше.

При обсуждении стоимости систем GB10 важно учитывать, что адаптер ConnectX-7 составляет значительную часть общей ценности устройства.

Если возникал вопрос, поддерживает ли сетевой адаптер RDMA и RoCE — да, поддерживает. Ниже — подтверждение на практике.

Дополнительно: тот же вывод можно получить при подключении через MikroTik CRS812 DDQ (CRS812-8DS-2DQ-2DDQ). Я сообщил NVIDIA, что у меня есть коммутатор, способный выдать шесть портов 200GbE и при этом оставить восемь портов 50GbE. Порты QSFP56-DD делятся на 2×200GbE, а также доступны два отдельных порта QSFP56.

Отдельно стоит отметить: при прямом подключении устройства автоматически договариваются о скорости 200GbE. При использовании коммутатора MikroTik настройку скорости портов на 200 Гбит/с нужно выполнять вручную.

С учётом поддержки высокоскоростных RDMA-сетей, можно ожидать, что такие системы начнут объединять в кластеры.

Дополнительно: в системе есть сетевой порт 10Gbase-T на базе Realtek и модуль Wi-Fi 7 от Mediatek. Беспроводное подключение можно использовать для первоначальной настройки устройства.

Топология NVIDIA DGX Spark

Ниже представлена примерная топология системы при использовании одного устройства Spark.

На диаграмме топологии видно 20 ядер Arm Cortex: 10 производительных Cortex-X925 и 10 энергоэффективных Cortex-A725. Это не самая яркая часть системы. Ключевая особенность — 120 ГБ общей доступной памяти сверху. В отличие от систем на базе AMD Strix Halo, здесь используется единая память, без разделения на объёмы для CPU и GPU (например, 32 ГБ и 96 ГБ). Вместо этого — единый пул объёмом 128 ГБ.

Также на схеме представлены сетевой адаптер Realtek 10GbE, адаптер NVIDIA ConnectX-7 на 200GbE, накопитель NVMe на 4 ТБ и GPU Blackwell с 48 вычислительными блоками.

Обзор программного обеспечения NVIDIA DGX Spark

На программном уровне система работает под управлением NVIDIA DGX OS — дистрибутива на базе Ubuntu с предустановленными драйверами и инструментами NVIDIA. В состав также входит панель управления NVIDIA DGX Dashboard. Мы частично показали процесс настройки в видео, но из-за проблем с выводом изображения заснять всё для обзора было сложно. Есть два режима начальной настройки: локальный — напрямую через подключённый монитор, и сетевой — при котором модуль Wi-Fi 7 переходит в режим точки доступа, а подключение к устройству происходит по беспроводной сети.

В комплекте с системой поставляется программа NVIDIA Sync. Сначала она показалась незначительной, но при использовании впечатление изменилось. NVIDIA Sync упрощает удалённую работу с системой — настраивает ПО, туннели SSH и другие компоненты, чтобы веб-интерфейсы работали корректно без дополнительной ручной настройки. Нам объяснили, что систему можно распаковать, включить без монитора и настроить удалённо. В нашем случае мы установили на Spark VPN-клиент Tailscale — в сочетании с NVIDIA Sync это позволило подключиться к системе на расстоянии около 1000 км. Такое решение оказалось очень удобным.

Для понимания возможностей: эта связка позволяет быстро развернуть окружение Cursor с аппаратным ускорением на базе DGX Spark.

Из коробки доступны интеграции с NVIDIA AI Workbench и Visual Studio Code, что упрощает настройку среды разработки и запуск AI-проектов.

На скриншоте — Open WebUI с моделями Ollama. В адресной строке указан localhost:12000, хотя физически система находится в студии, а доступ к ней осуществляется удалённо. Это работает благодаря NVIDIA Sync — интерфейс воспринимается как локальный, хотя пользователь находится в другом штате.

Вместе с DGX Spark NVIDIA выпускает серию обучающих материалов по работе с системой. В них представлены примеры с LLM-моделями, генерацией изображений, тонкой настройкой, RAG и другими задачами. Такой подход сильно упрощает старт и может служить ориентиром для AMD и, возможно, Intel.

Производительность NVIDIA DGX Spark

Если отступить на шаг назад, GPU в DGX Spark по производительности FP4 примерно соответствует NVIDIA GeForce RTX 5070 (~1 PFLOP). Это не уровень RTX 5090 — устройство компактное и с меньшей пропускной способностью памяти. Зато здесь используется единая архитектура памяти объёмом 128 ГБ. Это позволяет загружать сразу несколько моделей и использовать более крупные модули без ограничений на объём доступной памяти между CPU и GPU.

При использовании Ollama без дополнительной настройки, с моделью OpenAI gpt-oss 20B, скорость генерации часто превышала 49 токенов в секунду.

На этом останавливаться не нужно — система позволяет запускать и крупные модели, такие как gpt-oss 120B. В этом случае удалось добиться скорости генерации 14,48 токена в секунду.

Модель Qwen3 32B показывает стабильную работу «из коробки» со скоростью 9–10 токенов в секунду.

Производительность NVIDIA GB10 Geekbench CPU

Быстрый факт: 20-ядерный CPU может остаться недооценённым, но на практике он довольно производительный. Ниже — пример сравнения результатов теста Geekbench 5 CPU с системой на базе AMD Strix Halo. Важно: GB10 на данный момент поддерживает только Linux, но это просто ориентир для понимания уровня производительности.

Ниже — сравнение результатов Geekbench 5 с системой Minisforum S1-Max на базе AMD Strix Halo. В этой конфигурации Strix Halo работает на более высоком уровне мощности по сравнению с версией в корпусе GMKTec.

Учитывая производительность и набор интерфейсов, установленный в системе процессор — вероятно, лучшее решение среди мини-ПК на Arm с Ubuntu на сегодняшний день.

Начальные проблемы NVIDIA GB10

При работе с GB10 есть несколько заметных сложностей. Неожиданно, но одной из проблем оказалась видеовыход — область, в которой от устройства NVIDIA ожидаешь полной надёжности. В случае со Spark вывод изображения оказался нестабильным. Мониторы LG OLED с разрешением 1440p показывают искажённую картинку при установке соответствующего разрешения через HDMI. Также не удалось добиться работы с ультраширокими мониторами.

В итоге использовали старый 4K-дисплей с разрешением 3840×2160 и частотой 60 Гц — изображение выводилось корректно. Решение не самое удобное, но оно сработало.

Важный момент: это ранний образец, и некоторые особенности ещё не до конца проработаны. Например, после одного из обновлений энергопотребление GPU в простое по данным nvidia-smi снизилось с 13 Вт до 4 Вт — такие колебания не редкость на этом этапе. Общее ощущение — система ещё в процессе доработки, и с течением времени станет стабильнее. Но это требует определённого доверия к тому, как будет развиваться поддержка.

Потребляемая мощность NVIDIA DGX Spark

В комплект входит адаптер питания USB-PD мощностью 240 Вт.

При замерах на прошлой неделе система потребляла в простое 40–45 Вт. При нагрузке только на CPU — до 120–130 Вт. При включении GPU и других компонентов — чуть менее 200 Вт. До максимальных 240 Вт не дошли, но стоит учитывать, что оптические модули QSFP56 тоже потребляют заметную мощность.

Во многих задачах ИИ-инференса с LLM-моделями энергопотребление находилось в диапазоне 60–90 Вт. При этом система оставалась очень тихой: вентилятор работал, но на расстоянии 1–1,5 метра его почти не слышно. Уровень шума не превышал 40 дБА, если не запускать стресс-тесты.

Основные итоги

Когда мы впервые увидели эти системы, первое впечатление было: «Это решение для AI-разработчиков». Отчасти это так — ограниченная пропускная способность памяти действительно влияет на производительность по сравнению с крупными GPU. Однако на практике область применения может оказаться гораздо шире.

С начала 2025 года я уже совершил 86 перелётов. У нас есть ноутбук Dell Pro Max 18 Plus с мощным мобильнымGPU NVIDIA RTX Pro 5000 Blackwell — отличная AI-машина, и она попала в видео. Но такой ноутбук крупный и тяжёлый, и его неудобно использовать, если часто работать в дороге, особенно в самолётах. Вариант с компактным 14-дюймовым или ультратонким ноутбуком плюс DGX Spark выглядит гораздо практичнее. Устройство достаточно компактное, чтобы помещаться в ручную кладь и служить полноценной AI-станцией в поездках.

Помимо портативности, система предлагает 128 ГБ памяти LPDDR5X и возможность масштабирования в кластер через RDMA-сеть на 200 GbE. Это позволяет запускать крупные модели — пусть и не с максимальной скоростью. На первый взгляд это может показаться неважным, но для руководителей, работающих с конфиденциальными данными, которые нельзя передавать в облако, возможность запускать большие модели локально имеет значение. Чем больше количество параметров у LLM, тем выше потенциальная точность ответов. А значит, важна поддержка таких моделей. С 128 ГБ памяти это становится возможным — даже на компактной системе. Теперь те, кто раньше не мог использовать более точные LLM на тонких ноутбуках, могут запускать их локально, легко и без настройки инфраструктуры.

Конечно, часть меня хотела бы видеть в таком устройстве пропускную способность памяти выше 273 ГБ/с. С текущими характеристиками система больше подходит для прототипирования, чем, например, NVIDIA RTX Pro 6000 Blackwell Edition. Последняя — гораздо быстрее в масштабируемых сценариях. Тем не менее, возможность масштабировать Spark тоже впечатляет. Многие пользователи будут хотеть больше производительности просто потому, что привыкли к ней. Но эта система создавалась не для максимальной мощности, а для компактности и удобства — её можно взять с собой в ручной клади или рюкзаке, даже две штуки сразу. Важно другое: Spark — это не просто «крутое» устройство. Оно делает запуск крупных локальных моделей доступным для гораздо более широкой аудитории.

Выводы

Система находится у нас всего несколько дней, и важно сказать прямо: это ещё не самая зрелая платформа NVIDIA, особенно в предрелизном или только что выпущенном состоянии. Но, несмотря на это, сложно избавиться от ощущения, что перед нами — переломный продукт. 128 ГБ единой памяти позволяют запускать крупные модели без дополнительных GPU или ускорителей — используется архитектура NVIDIA Blackwell. Вместо сложных и нестабильных решений вроде сетей на базе Thunderbolt здесь установлен полноценный высокоскоростной адаптер 200 GbE с поддержкой RDMA. С точки зрения CPU это, пожалуй, лучший (хоть и дорогой) мини-ПК на базе Arm для настольного использования. Альтернатив с таким уровнем производительности и возможностями сейчас просто нет.

Хотя у нас в студии сейчас несколько систем GB10, будь возможность купить ещё одну — я бы сделал это сразу. Это действительно одни из самых «крутых» мини-ПК. Но помимо внешней привлекательности, они меняют подход к локальной разработке ИИ. Да, хотелось бы в два раза большую пропускную способность памяти, но даже в текущей конфигурации система открывает возможности, которых не было у решений с PCIe-GPU. Скорее всего, спрос на NVIDIA DGX Spark будет высоким. Ожидаю, что в ближайшие недели достать такое устройство будет непросто.

Источник