NVIDIA、次世代AIスーパーコンピューター「Rubinプラットフォーム」を発表 — 6つの新チップでAI導入を加速

未分類

Rubinプラットフォームを構成する6つの新チップ

Rubinプラットフォームは、以下の6つのチップ全体で緊密な協調設計を採用しています。

これらのチップは、トレーニング時間を大幅に短縮し、推論トークンのコストを大幅に削減することを目指しています。

5つの革新的な技術

Rubinプラットフォームは、エージェント型AI、高度なリーズニング、大規模なMoEモデルの推論を高速化するために、以下の5つの革新的な技術を導入しています。

  • 第6世代 NVIDIA NVLink: 各GPUが3.6TB/sの帯域幅を提供し、Vera Rubin NVL72ラックは260TB/sの帯域幅を実現します。これにより、大規模なAIトレーニングと推論がより迅速かつ効率的に行われます。

  • NVIDIA Vera CPU: エージェント型リーズニング向けに設計されたCPUで、88個のNVIDIAカスタムOlympusコアとArmv9.2との完全な互換性を持ち、電力効率に優れています。

  • NVIDIA Rubin GPU: ハードウェアアクセラレーション対応のアダプティブ圧縮機能を備えた第3世代Transformer Engineを搭載し、AI推論向けに50ペタフロップスのNVFP4コンピューティングを提供します。

  • 第3世代 NVIDIA Confidential Computing: Vera Rubin NVL72は、NVIDIA Confidential Computingを提供する初のラックスケールプラットフォームとして、データセキュリティを維持し、大規模な独自モデル、トレーニング、推論ワークロードを保護します。

  • 第2世代 RAS エンジン: GPU、CPU、NVLinkを網羅し、リアルタイムの健全性チェック、耐障害性、予防保守機能を備えることで、システムの生産性を最大化します。

AIネイティブストレージと安全なソフトウェアデファインドインフラ

Rubinは、推論コンテキストをギガスケールで拡張するために設計されたNVIDIA Inference Context Memory Storage Platformを導入します。このプラットフォームはNVIDIA BlueField-4を搭載し、AIインフラ全体でKVキャッシュデータを効率的に共有および再利用できます。BlueField-4は、Advanced Secure Trusted Resource Architecture (ASTRA)も導入し、大規模AI環境の安全なプロビジョニング、分離、運用を可能にします。

多様なシステム形態と次世代イーサネットネットワーキング

Rubinプラットフォームは、様々なワークロードに対応するために、NVIDIA Vera Rubin NVL72NVIDIA HGX Rubin NVL8などのシステムを提供します。また、NVIDIA DGX SuperPOD™は、Rubinベースのシステムを大規模に展開するためのリファレンスとして機能します。

ネットワーキングにおいては、NVIDIA Spectrum-6 イーサネットが次世代AIネットワーキングを担い、Spectrum-X Ethernet Photonics Co-Packaged Optics スイッチ システムは、AIアプリケーション向けに信頼性、稼働時間、電力効率を大幅に向上させます。さらに、Spectrum-XGS Ethernet テクノロジにより、数百キロメートル以上離れた施設を単一のAI環境として機能させることが可能です。

幅広いエコシステムサポートと提供状況

NVIDIA Rubinは量産段階に入っており、Rubinベースの製品は2026年後半にパートナーから提供開始予定です。主要なAI研究所、クラウドサービスプロバイダー、コンピューターメーカー、スタートアップがRubinの採用を予定しています。

Microsoftは、将来のFairwater AIスーパーファクトリーを含む次世代AIデータセンターの一環として、NVIDIA Vera Rubin NVL72ラックスケール システムを展開する予定です。CoreWeaveは、2026年後半からNVIDIA RubinベースのシステムをAIクラウドプラットフォームに統合する予定であり、CoreWeave Mission Controlを通じて性能、運用信頼性、拡張性を提供します。

また、Cisco、DellHPELenovoSupermicroから、Rubin製品をベースにした幅広いサーバーが提供される予定です。

インフラソフトウェアおよびストレージパートナーとしては、CanonicalDDNNutanixSUSEWEKAなどがNVIDIAと協力し、Rubinインフラ向けの次世代プラットフォームを設計しています。Red HatはNVIDIAとの協業を拡大し、Rubinプラットフォーム向けに最適化された完全なAIスタックを提供することを発表しています。

関連情報

コメント

タイトルとURLをコピーしました