NVIDIAがフィジカルAI開発を加速するオープンソースのツールとスキルを発表

NVIDIAは、現実世界で物理的に動くAI、通称「フィジカルAI」の開発を助けるための、オープンソースのツールとスキルの大きなコレクションを発表しました。これには、ロボット技術、自動運転車、映像を分析するAI(ビジョンAI)、そして工場などの産業で使うデジタルツインといった分野が含まれます。

ロボット、自動化、製造業、都市のイメージ

フィジカルAIとは

フィジカルAIとは、ロボットや自動運転車のように、現実世界で動き、物事を認識し、判断して行動するAIのことです。これらのAIは、データを作り出すこと、シミュレーションで試すこと、学習させること、そして実際に動かして評価することなど、多くの複雑な開発プロセスが必要です。NVIDIAが今回発表したツールとスキルは、これらの作業をAIエージェントが自動で行えるようにすることで、開発にかかる費用や時間、手間を減らすことを目指しています。

NVIDIAの創業者兼CEOであるジェンスン・フアン氏は、「AIエージェントはソフトウェア開発を大きく変えつつあり、その影響は今、フィジカルAIにまで広がっています。エージェントがNVIDIAの技術を直接使えるようになれば、フィジカルAIの開発はさらに速くなり、未来のロボットや自動運転車、産業システムが驚くほどの速さで生み出されるでしょう」と述べています。

エージェントで開発を進めるNVIDIAの技術

NVIDIAは、AIエージェントが利用できるフィジカルAIのためのさまざまな技術を提供しています。これには、現実世界を理解し、新しいものを生み出すための「NVIDIA Cosmos™」という世界基盤モデル、シミュレーションやデジタルツインのための「NVIDIA Omniverse™」ライブラリ、ロボットのシミュレーションや学習のための「NVIDIA Isaac™」、映像AIのための「NVIDIA Metropolis」、自動運転のための「NVIDIA Alpamayo」、そして小型AIデバイス向けの「NVIDIA Jetson™」プラットフォームなどが含まれます。

これらのツールを開発者が使いこなせるように、「NVIDIA Agent Toolkit」の一部として新しいスキルが公開されました。これらのスキルは、AIエージェントがどのようなツールを使い、どんな結果を出すべきか、そしてその結果をどう確認するかといった、フィジカルAI開発のプロセスを自動化するための具体的な指示を教えてくれます。また、開発者は「NVIDIA NemoClaw™」の設計図や「NVIDIA OpenShell™」というプログラムを使って、これらのスキルを活用し、安全にAIエージェントを作り、動かすことができます。

幅広い分野での応用

NVIDIAのフィジカルAIのスキルとツールは、以下のような分野でAIエージェントの開発を加速させます。

  • ロボット技術とエッジAI: ロボットが周囲を認識したり移動したりするためのデータ作成から、シミュレーション、ナビゲーションの学習、ロボットの学習能力の向上、そして小型デバイスへの展開まで、開発プロセス全体を速めることができます。

  • 自動運転車: AIエージェントに指示を出し、車から集めたデータをシミュレーション環境で再現したり、リアルな走行シーンを大量に作ったりすることで、自動運転システムの開発を強化します。

  • リアルタイム映像AIエージェント: 自動で物を検査したり、防犯カメラなどの映像を分析したりするために、AIエージェントが学習データを作ったり、モデルの調整やデータの分類を自動で行ったりするのに役立ちます。

  • 産業用AI: 工業製品の設計データ(CADデータ)をデジタルツインのシミュレーションで使える形に変換したり、大規模なデジタルシーンを効率的に最適化したりできます。

  • ヘルスケア: 病院のデジタルツインを作ってシミュレーションを行ったり、実際の環境で使うためのデータを作ったりすることで、医療現場にAIを導入する前に安全にテストできます。

これらのスキルを組み合わせることで、開発者はデータ生成、シミュレーション、最適化、AIの調整、継続的な評価といった複雑な作業を自動化し、調整できるようになります。

業界リーダーによる活用事例

製造業、自動運転車、ヘルスケア、産業用ソフトウェアなど、さまざまな分野のリーダー企業がNVIDIAのフィジカルAI技術を活用し、自律システムや産業用AIの開発を進めています。これらの技術がAIエージェントに対応することで、企業はより効率的に開発を進めることができます。

例えば、電子機器製造では、TSMCやPegatronが製品の見た目を検査するAIモデルの調整を行っています。Pegatronは、欠陥画像を生成するスキルを使うことで、モデルの学習と展開にかかる時間を67%短縮しました。Delta Electronicsは、金属部品のはんだ付けの欠陥を検出するのにこのスキルを活用し、検出率を17%向上させました。InventecやFoxconnも同様に、AIを活用して生産ラインの効率を上げています。

自動運転車の分野では、Li Auto、Afari、DeepRoute.aiなどがNVIDIAの技術を使い、1日に1,000以上のシーンを再現し、30万回以上のシミュレーションを行って、より安全で高性能な自動運転システムの開発を加速させています。

産業用AIでは、Cadence、Dassault Systèmes、Siemens、Synopsysといった企業が、NVIDIA Omniverseのライブラリとスキルを使い、エンジニアリングデータの検査、シミュレーション、デジタルツインの構築に役立てています。PTC、MetAI、Lightwheelは、CADデータをシミュレーションで使える資産に変換するのにNVIDIA Isaac Sim™フレームワークを活用しています。SK hynixは、半導体工場のデジタルツインにNVIDIA Omniverseを導入し、製造業向けのフィジカルAIを検証しています。

ロボット分野では、1x、Agile Robots、Agility、FieldAI、Hexagon Robotics、NEURA Robotics、Skild AI、Universal Robotsといった企業が、NVIDIAのAIスタックを活用してロボット開発を高速化しています。

ヘルスケア分野では、FoxconnとCompalが病院向けのロボット導入を進めています。Foxconnは、AIを搭載したロボット「Nurabot」を病院や介護施設に展開し、患者ケアの現場を支援しています。Compalは、病院全体のシステムと連携するロボット「PolyMedX」の開発を進めています。

入手方法とさらなる情報

NVIDIAのフィジカルAIエージェントツールとスキルは、以下の場所で公開されており、誰でも利用できます。

特に、合成データ生成のためのエージェントスキルとツールであるNeural Reconstruction、Video Augmentation、Defect Image Generationは、NVIDIA Brev上で「Physical AI Launchables」としてすぐに試すことができます。これは、合成データの生成と評価をより早く行えるように、あらかじめ設定された環境として提供されています。

また、Microsoft、CoreWeave、Nebiusといった企業は、これらのAIエージェントスキルとツールをクラウドサービスと連携させ、開発者が合成データの生成や展開を効率的に行い、規模を拡大できるようにしています。

NVIDIAの創業者兼CEOであるジェンスン・フアン氏の基調講演や、NVIDIA GTC Taipeiのウェブサイトで、さらに詳しい情報を確認できます。

今回の発表は、AIエージェントが現実世界で活躍するフィジカルAIの開発を大きく前進させるものとなるでしょう。

×