NVIDIA、AIファクトリー向け推論OS「Dynamo 1.0」を提供開始 – 大規模AIの効率化を支援
NVIDIA、AIファクトリー向け推論OS「Dynamo 1.0」を提供開始 – 大規模AIの効率化を支援
NVIDIAは、大規模な生成AIやエージェント型AIの推論を効率的に行うためのオープンソースソフトウェア「NVIDIA Dynamo 1.0」の提供を開始しました。このシステムは、NVIDIA Blackwellプラットフォームと組み合わせることで、クラウドプロバイダー、AIイノベーター、グローバル企業が、高速かつ効率的にAI推論を実行できるよう支援します。

AI推論の複雑な課題に対応
AIシステムが実用化されるにつれて、データセンター内でのAI推論の規模拡大は、リソースの管理において複雑な課題を抱えています。さまざまなサイズや形式、性能目標を持つリクエストが予測できない形で発生するため、これを効率的に処理することが求められます。
Dynamo 1.0は、AIファクトリーにおける分散型の「オペレーティングシステム」として機能します。コンピューターのオペレーティングシステムがハードウェアとアプリケーションを連携させるように、Dynamo 1.0はクラスター全体のGPUとメモリリソースをスムーズに調整し、複雑なAIワークロードを最大限の効率で動かします。
Dynamo 1.0による性能向上
最近の業界ベンチマークでは、Dynamoはオープンソースソフトウェアながら、NVIDIA Blackwell GPUの推論パフォーマンスを最大で7倍向上させたと報告されています。これにより、数百万個のGPUにおけるトークン処理コストが削減され、収益機会の増大に貢献すると考えられます。
NVIDIAの創業者兼CEOであるジェンスン フアン氏は、推論がAIのあらゆる活動を支えるエンジンであるとし、DynamoがAIファクトリー向けの初の「オペレーティングシステム」であると述べています。
Dynamo 1.0は、より高度な「トラフィック制御」やGPUと低コストストレージ間のデータ移動機能を備えています。これにより、推論作業をGPU間で分散させ、無駄な作業を減らし、メモリの制約を緩和します。特にエージェント型AIや長いプロンプトの場合、以前のステップからの関連性の高い「短期記憶」を持つGPUにリクエストを振り分け、不要なメモリはオフロードできるようになります。
広がるNVIDIA推論プラットフォームの採用
NVIDIAは、DynamoおよびNVIDIA TensorRT™-LLMライブラリの最適化を、LangChain、llm-d、LMCache、SGLang、vLLMといった主要なオープンソースフレームワークに統合し、エコシステムの発展を加速させています。
NVIDIA推論プラットフォームは、幅広いAIエコシステムで利用されています。
-
クラウドサービスプロバイダー:
-
NVIDIAクラウドパートナー: Alibaba Cloud (詳細はこちら)、CoreWeave、Crusoe、DigitalOcean、Gcore、GMI Cloud、Lightning AI、Nebius、Nscale、Together AI、Vultr
-
AIネイティブ企業: Cursor、Hebbia、Perplexity
-
推論エンドポイントプロバイダー: Baseten、Deep Infra、Fireworks
-
グローバル企業: Amazon、AstraZeneca、BlackRock、ByteDance、Coupang、Instacart、Meituan、PayPal、Pinterest、Shopee、ソフトバンク株式会社
CoreWeaveの製品およびエンジニアリング担当バイスプレジデントであるChen Goldberg氏は、AIが試用段階から大規模な本番環境へ移行する中で、インフラも同様に柔軟であるべきだと述べています。NVIDIA Dynamoのサポートにより、複雑なAIエージェントの展開がよりスムーズかつ強固な環境で可能になると期待されています。
Nebiusの最高技術責任者であるDanila Shtan氏は、大規模で信頼性の高いAI推論には高性能なGPUだけでなく、その性能を顧客の成果に変えるソフトウェアが重要であると指摘しています。NVIDIAのソフトウェアスタックが、高度な最適化、予測可能なパフォーマンス、展開時間の短縮を実現し、AIの本番稼働への移行をよりシンプルかつ高性能なものにしていると評価しています。
Pinterestの最高技術責任者であるMatt Madrigal氏は、数億人のユーザーに直感的なマルチモーダルAI体験を提供するためには、グローバル規模でのリアルタイムなAIが必要であると述べています。オープンソースを積極的に採用する同社は、NVIDIA Dynamoが展開を最適化することで、高性能なAIインフラを活用したパーソナライズされた体験の提供を拡大していると説明しています。
Together AIの共同創業者兼CEOであるVipul Ved Prakash氏は、AIネイティブ企業はアプリケーションとともに、信頼性と効率性を備えた推論の拡張を必要としていると述べています。NVIDIA Dynamo 1.0とTogether AIの推論研究を組み合わせることで、大規模な本番ワークロード向けに高速で費用対効果の高い推論を実現する高性能なスタックを提供できると語っています。
提供開始と詳細情報
Dynamo 1.0は、2026年3月16日より世界中の開発者に提供されています。
詳細情報や展開方法については、以下のリンクをご覧ください。


