Nvidia は NitroGen を使用して、すべての世界のためのユニバーサル AI エージェントを作成したいと考えている
概要
Nvidia は、多様な仮想環境でユニバーサル AI エージェントとして機能するように設計された新しいオープンビジョンアクションモデル、NitroGen をリリースしました。このモデルは、YouTube や Twitch から収集された 40,000 時間のゲームプレイビデオを使用して訓練され、研究者たちは目に見えるコントローラーのオーバーレイに対してテンプレートマッチングと微調整された SegFormer モデルを使用してプレイヤー入力を抽出しました。Nvidia の GR00T N1.5 ロボティクスモデルを基盤とする NitroGen は、ロボティクス基盤モデルが異なる物理エンジンやビジュアルスタイルを持つ仮想環境全体で普遍的に機能することを示す最初のモデルであり、アクションRPGやローグライクなどのジャンルに対応します。未知のゲームでテストされた際、ゼロから訓練されたモデルよりも最大 52% 高い成功率を達成しました。Nvidia、スタンフォード大学、Caltech などの研究者を含むチームは、データセット、モデルの重み、論文、コードを一般公開しています。
(出典:The Decoder)