
「社内で大規模言語モデル(LLM)を動かしたいが、データセンター規模のGPUサーバーは導入ハードルが高い」――そんな課題を抱える企業が増えています。NVIDIA DGX Spark とは、デスクトップサイズでありながら 1 PFLOP の AI 演算性能を実現する、まったく新しいカテゴリの AI スーパーコンピュータです。DGX Spark 仕様の中核となる GB10 Superchip により、オンプレミスLLM の運用がこれまでにない手軽さで可能になりました。本記事では、DGX Spark の基本概要からスペック詳細、企業での具体的な活用シーンまでを徹底解説します。
NVIDIA DGX Spark とは?基本概要
NVIDIA DGX Spark とは、NVIDIA が 2025 年 1 月の CES で発表し、2025 年 5 月から出荷を開始したデスクトップAI スーパーコンピュータです。従来の DGX シリーズはデータセンター向けの大型ラックサーバーでしたが、DGX Spark はオフィスの机の上に置ける小型筐体に凝縮されています。
搭載する GB10 Superchip は、NVIDIA の最新 Grace CPU と Blackwell GPU を 1 チップに統合したプロセッサです。128GB の統合メモリにより、200B パラメータクラスのオンプレミスLLM もローカルで推論可能です。NVIDIA はこれを「パーソナル AI スーパーコンピュータ」と位置づけていますが、そのスペックは企業のAI基盤としても十分に通用します。
NVIDIA DGX Spark の仕様・スペック
DGX Spark 仕様の全体像を以下の表にまとめます。
| 項目 | 仕様 | ポイント |
|---|---|---|
| GPU/SoC | GB10 Superchip(Grace + Blackwell) | CPU-GPU統合で低レイテンシ |
| メモリ | 128GB 統合メモリ(LPDDR5X) | 200Bパラメータモデルに対応 |
| AI演算性能 | 1 PFLOP(FP4) | デスクトップAI史上最高 |
| ストレージ | 最大4TB NVMe SSD | 大規模RAGデータも格納 |
| サイズ | Mac Studioと同等の小型筐体 | オフィス設置が容易 |
| 消費電力 | 約150W(標準デスクトップ並) | 専用電源工事不要 |
| OS | DGX OS(Ubuntu Linux ベース) | NVIDIA AI Enterpriseプリインストール |

この DGX Spark 仕様が示す通り、従来は数百万円のラックサーバーでしか得られなかった性能が、デスクトップAI として手の届く形になっています。
NVIDIA DGX Spark で何ができるのか
DGX Spark の高い演算性能を活かすことで、企業では以下のようなAI活用が可能です。
社内LLMの運用
128GB の統合メモリにより、Llama 3 や Qwen3 クラスの大規模モデルをローカルで推論できます。クラウドAPIに依存しないため、機密情報を含むデータも安全に処理可能です。
RAGで社内文書検索
社内のマニュアル・議事録・技術文書をベクトルDB化し、RAG(検索拡張生成)パイプラインを構築できます。従来のキーワード検索では見つからなかった情報も、自然言語で的確に取得できます。
VLMで図面・画像分析
ビジョン言語モデル(VLM)を活用すれば、建設図面や製造部品の画像をAIが読み取り、不整合の検出やレビュー支援が可能です。
社内ヘルプデスク自動化
オンプレミスLLM を社内チャットボットとして運用すれば、IT部門や人事部門への問い合わせを自動化できます。

GBase OnSpark:DGX Spark で実現する企業AI基盤
GBase OnSpark は、DGX Spark 上に企業向けAI基盤をワンパッケージで提供するソリューションです。ハードウェアの調達からモデル選定、RAG構築、本番デプロイまでを一貫してサポートします。
搭載モデルの性能
GBase OnSpark では、用途に応じて最適なモデルを選択可能です。
- OSS-GPT-120B(117Bパラメータ):MMLU-Pro 90.0% を達成し、GPT-4o の 87.0% を上回る推論精度。社内の複雑な質問応答や文書分析に最適です
- Qwen3-Next-80B(80Bパラメータ、256Kコンテキスト):長文書の一括処理に強く、契約書レビューや技術マニュアル分析に威力を発揮します
導入スピードとコスト
- 2週間 PoC:既存の社内文書でRAG検索の精度を検証
- 1ヶ月 本番稼働:PoC結果をもとにチューニングし、全社展開
- コスト:従来のGPUサーバー構成と比較して約1/20のコストで導入可能


GBase OnSparkなら、オンプレミスLLMの導入課題を解決できます
導入事例:ある建設社の図面AIレビュー
GBase OnPrem の導入事例として、A社における建設図面のAIレビューが挙げられます。同社では、VLMを活用して建築図面の不整合箇所を自動検出するシステムを構築しました。従来は熟練技術者が数日かけて行っていた図面チェックを、AIが数分で完了します。
この取り組みは情報処理学会(IPSJ)との共同発表としても公開されており、建設業界におけるオンプレミスAI活用の先行事例として注目を集めています。機密性の高い建設図面データを社外に出さず、DGX Spark のようなデスクトップAI 上でVLM推論を完結させるアーキテクチャが評価されています。
DGX Spark vs クラウドAI:どちらを選ぶべきか
DGX Spark によるオンプレミス構成とクラウドAIサービスの比較ポイントを整理します。
- セキュリティ:DGX Spark はデータが社内ネットワークから出ないため、金融・医療・建設など規制業界に最適。クラウドAIはデータの外部送信が発生するため、社内セキュリティポリシーとの整合が必要
- コスト構造:DGX Spark は初期投資型で、利用量に関係なく固定コスト。クラウドAIはトークン従量課金のため、利用量が増えるほどコストが膨らむ
- カスタマイズ性:オンプレミス環境ではモデルの選択・ファインチューニング・RAGパイプラインの構築が自由。クラウドAPIは提供元の仕様に依存する
- スケーラビリティ:クラウドAIは即時スケール可能。DGX Spark は NVLink で2台接続によるスケールアップに対応するが、大規模クラスタにはDGX SuperPODが別途必要
セキュリティ要件が厳しく、利用量が安定している企業には DGX Spark + GBase OnSpark の組み合わせが最適解です。
まとめ
NVIDIA DGX Spark とは、デスクトップサイズに 1 PFLOP の AI 性能を凝縮した新世代のオンプレミスAI基盤です。GB10 Superchip と 128GB 統合メモリにより、企業が求めるオンプレミスLLM の運用を現実的なコストとサイズで実現します。GBase OnSpark を活用すれば、PoC からわずか1ヶ月で本番環境のAI基盤を構築可能です。
よくある質問(FAQ)
Q1: DGX Sparkの価格は?
NVIDIA の公式価格は 3,000ドル前後からとされています。ただし企業向けの GBase OnSpark パッケージでは、ハードウェア+ソフトウェア+導入サポートを含めた一括見積もりが可能です。従来のGPUサーバー構成(数百万〜数千万円)と比較して約1/20のコストに抑えられます。
Q2: 個人でも購入できる?
はい、DGX Spark は個人開発者や研究者向けにも販売されています。NVIDIA の公式ストアや認定リセラーから購入可能です。ただし企業での本格活用には、モデル最適化やRAG構築を含む GBase OnSpark のような導入支援サービスの活用を推奨します。
Q3: WindowsやmacOSで使える?
DGX Spark のOSは DGX OS(Ubuntu Linux ベース)です。Windows や macOS のネイティブ動作には対応していません。ただし、ネットワーク経由でWindows / macOS端末からWebブラウザ経由でアクセスする運用が一般的です。
Q4: 2台をクラスターにできる?
はい、NVLink で DGX Spark 2台を接続し、メモリを合算(256GB)して利用可能です。これにより400Bパラメータクラスの超大規模モデルにも対応できます。
Q5: GBase OnSparkの導入にどのくらいかかる?
PoC(概念実証)は最短2週間、本番環境への展開は約1ヶ月が目安です。既存の社内文書やナレッジベースを活用したRAG構築から、モデル選定・チューニングまで、専任エンジニアが一貫してサポートします。
