NVIDIAベラ・ルービン、600キロワットラックと100万トークンメモリでGPUの常識を覆す
NVIDIAのジェンセン・フアン最高経営責任者(CEO)は2025年のGTCで爆弾発言をし、インフラチームを電卓探しに躍起にさせた。ヴェラ・ルービン・プラットフォームは、2027年までにデータセンターのラックを600キロワットまで押し上げるだろう。
Vera Rubinプラットフォームは、NVIDIAのこれまでで最も野心的な飛躍を象徴しています。このマルチコンポーネント・システムは、カスタムVera CPU、次世代Rubin GPU、および100万トークンのAIワークロードのために特別に設計されたRubin CPX(Context Processing eXtension)アクセラレータを組み合わせています。
「インフラプロバイダー、データセンター事業者、そしてIntrolのような企業に、AIインフラの完全な再構築に向けた準備に必要なリードタイムを与えるためだ。
NVIDIA Vera Rubin NVL144プラットフォーム仕様、FP4推論性能3.6エクサフロップス、GB300 NVL72の3.3倍向上、2026年後半に登場。
アーキテクチャー革命はカスタム・シリコンから始まる。
NVIDIAのBlackwellからFeynmanまでの完全なロードマップは、Oberonから最大600kWの消費電力をサポートするKyberラック・アーキテクチャへの進化を示しています。
Vera CPUは、NVIDIAが既製のARM設計からの脱却を示すもので、同時マルチスレッディングを備えた88個のカスタムARMコアを搭載し、176個の論理プロセッサを実現する。各Vera CPUは、1.8TB/秒のNVLink C2Cインターフェイスを介してRubin GPUに接続され、コンピュートエレメント間の前例のないバンド幅を実現します。
標準的なRubin GPUは、パッケージあたり288GBのHBM4メモリで限界を押し広げ、Blackwell Ultra B300と同じ容量を維持しながら、メモリ帯域幅を8TB/秒から13TB/秒に向上させています。各Rubinパッケージには、レチクルで制限された2つのGPUダイが含まれていますが、NVIDIAはそのカウント方法を変更しました-Blackwellが1つのGPU(2つのダイ)と呼んでいたものを、Rubinは2つのGPUと呼んでいます。
最も革新的な要素は、マッシブコンテキスト処理用の専用アクセラレータである Rubin CPX の形で登場します。このモノリシックデザインは、30ペタFLOPsのNVFP4コンピュートと128GBのコスト効率に優れたGDDR7メモリーを提供し、特にトランスフォーマーモデルのアテンションメカニズム向けに最適化されています¹⁰ CPXは、GB300 NVL72システムと比較して3倍高速なアテンション機能を実現し、AIモデルが100万トークンのコンテキスト(1時間のビデオまたはコードベース全体に相当)を性能低下なしに処理できるようにします¹¹。
配備にはインフラの全面的な見直しが必要だ。
2026年後半に登場予定の標準的なVera Rubin NVL144システムは、使い慣れたOberonラックアーキテクチャを利用し、既存のGB200/GB300インフラとの互換性を維持します。
Vera Rubin NVL144 CPXは、性能をさらに高め、144個のRubin CPX GPUと144個の標準的なRubin GPU、36個のVera CPUを統合し、8エクサFLOPsのNVFP4演算(GB300 NVL72の7.5倍向上)を、100TBの高速メモリと1.7PB/秒のメモリ帯域幅とともに1ラックで実現します。
2027年のRubin UltraとKyberラックアーキテクチャですべてが変わる。NVL576システムは、576個のGPUダイを1つのラックに詰め込み、現在のシステムの5倍である600kWの電力を消費します¹⁵ Kyberデザインは、コンピュートブレードを90度回転させて垂直方向に配置し、それぞれ18個のブレードからなる4つのポッドをラックに詰め込みます¹各ブレードには、Vera CPUと一緒に8個のRubin Ultra GPUが搭載され、ほんの数年前には不可能と思われた密度を実現します。
72GPUで1.1エクサフロップスを実現する現在のNVIDIA Blackwellシステム
将来のNVIDIA Rubinシステムは、600kWのラック1台で576GPUと15エクサフロップスに拡張可能
CoolIT SystemsとAccelsiusはすでに、入口水温40℃の250kWラックに対応可能な冷却ソリューションを実証しており、600kWの導入に向けた技術的な道筋を検証しています¹⁸ Kyberラックには、電源と冷却インフラ用の専用サイドカーが含まれているため、600kWシステム1台につき実質2つのラック設置面積が必要です¹⁹。
電力アーキテクチャの進化がメガワット規模のコンピューティングを可能にする。
NVIDIAの800VDC配電への移行は、現在のインフラストラクチャの基本的な物理的限界に対処するものです。従来の54Vのラック内配電では、Kyberスケールのシステム用に64Uの電源棚が必要となり、実際のコンピュート用のスペースがなくなってしまいます⁰ 800Vアーキテクチャは、ラックレベルでのAC/DC変換を排除し、エンドツーエンドの効率を最大5%改善し、メンテナンスコストを最大70%削減します¹。
Vera Rubin を導入する企業は、NVL576 ラック 1 台で一般家庭 400 戸分の電力を消費するため、大規模な電力アップグレードを計画する必要があります。2027年の導入を計画しているデータセンターは、電力会社規模の電力接続やオンサイト発電の可能性も含め、インフラのアップグレードを今すぐ始めるべきです。
イントロールのようなインフラのスペシャリストにとって、このシフトはかつてないチャンスを生み出す。ハイパースケールでGPUインフラを展開し、グローバルで10万台以上のGPUを管理する同社の専門知識と、APACでの広範なプレゼンスは、次のようなポジションにある。 APACにおける広範なプレゼンス組織は、GPUの導入だけでなく、600kWのシステムに必要な電力、冷却、ネットワークの複雑なダンスを理解するパートナーを必要としています。
パフォーマンス向上はインフラ投資を正当化する。
Vera Rubin NVL144 CPXバリアントは、8エクサフロップスのNVFP4コンピュートと、100TBの高速メモリ、1.7PB/秒のメモリ帯域幅を備えたプラットフォームの可能性を、すべて1つのラックで示しています。
初期導入企業には、ドイツのライプニッツ・スーパーコンピューティング・センターがあり、Blue LionスーパーコンピュータとVera Rubinを導入することで、現在のシステムの30倍の計算能力を達成する予定です。²⁶ ローレンス・バークレー国立研究所のDoudnaシステムもVera Rubin上で動作し、シミュレーション、データ、AIを科学計算のための単一プラットフォームに統合します。
Rubin CPXのコンテキスト処理への特化は、現在のAIシステムにおける重要なボトルネックに対処する。Cursor、Runway、Magicのような企業は、CPXがコーディング・アシスタントや、数百万トークンを同時に処理する必要があるビデオ生成アプリケーションをどのように高速化できるかをすでに模索しています⁸ コードベース全体や数時間のビデオをアクティブ・メモリに保持する能力は、AIアプリケーションが実現できることを根本的に変えます。
インフラの課題が市場機会を生み出す
600kWラックへの飛躍は、現在のデータセンターの能力に関する厳しい現実を露呈している。ほとんどの施設は40kWのラックで苦労しており、最先端のAIデータセンターでさえ120kWを超えることはめったにない。この移行には、新しい冷却システムだけでなく、巨大な重量負荷を支えることができるコンクリート床から、産業オペレーションに適したサイズの変電所まで、施設の完全な再設計が必要です。
「このような高密度な構成に対応できる既存のデータセンター施設がどれだけあるかは疑問が残る」とThe Registerは指摘し、カイバーラックの特注の性質が、施設が専用のインフラを必要とすることを強調している。
このタイムラインは業界に余裕を与えるが、早急な対応が求められる。2027年以降に向けてAIインフラを計画する組織は、施設の場所、電力調達、冷却アーキテクチャについて今すぐ決断しなければならない。3年というリードタイムは、物理的に可能なギリギリのところで稼働するインフラを展開することの複雑さを反映している。
ヴェラ・ルービンを越える道
NVIDIAのロードマップは、ベラ・ルービンを超えて2028年のファインマン・アーキテクチャにまで広がっており、おそらく1メガワット・ラックに向かって突き進んでいるものと思われる³¹ Vertivのジョルダーノ・アルベルタッツィCEOは、MW規模の密度を達成するには「液体冷却のさらなる革命と、電力面でのパラダイムチェンジ」が必要になると示唆している³²。
GPUインフラにおける漸進的な改善から革命的な変化へのシフトは、より広範なAIの変革を反映している。大規模な言語モデルが数十億から数兆のパラメーターへと飛躍したように、それをサポートするインフラも同様の飛躍を遂げなければならない。Vera Rubinは、GPUの高速化だけでなく、計算インフラの仕組みを根本的に見直すことを意味している。
GPUインフラの導入を専門とするIntrolのような企業にとって、Vera Rubinは世代交代の機会を創出する。組織は、初期計画から実装、継続的な最適化まで、600kWの展開の複雑さをナビゲートできるパートナーを必要としている。Vera Rubinの導入に成功した企業は、AI能力において大きな競争優位性を得るだろう。一方、躊躇している企業は、業界がエクサスケールのAIに向かって競争する中で、競争に敗れるリスクがある。
結論
NVIDIAのVera Rubinプラットフォームは、前例のない計算能力を提供する一方で、データセンター業界にインフラの限界に関する不快な真実と向き合うことを強いる。2027年の600kWラックは、単に消費電力が増えるだけでなく、AIインフラストラクチャの構築、冷却、運用方法の完全な変革を意味する。次世代の配備の複雑さを理解する経験豊富なインフラスペシャリストと提携し、今すぐ計画を開始する組織は、Vera Rubinが可能にする革命的な能力を活用するための最良の立場に立つことができるだろう。
このプラットフォームが2026年から2027年に登場することで、業界は準備の時間を得ることができるが、その時間は刻一刻と迫っている。今日設計されたデータセンターは明日の要件を予測する必要があり、ヴェラ・ルービンは、明日は従来の考え方から根本的に脱却することが必要だと明言している。この変革を受け入れる企業は、100万トークンの言語モデルから、今日ではSFのように思えるリアルタイムのビデオ生成システムまで、次世代のAIのブレークスルーを後押しするだろう。
参考文献
The Register.「Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks.".2025年3月19日。 https://www.theregister.com/2025/03/19/nvidia_charts_course_for_600kw.
NVIDIA Newsroom."NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference".2025. https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference.
同上。
⁴ Data Center Dynamics."GTC:Nvidiaのジェンセン・フアン、イアン・バック、チャーリー・ボイルが語るデータセンター・ラック密度の未来".2025年3月21日。 https://www.datacenterdynamics.com/en/analysis/nvidia-gtc-jensen-huang-data-center-rack-density/.
TechPowerUp."NVIDIA、Vera CPUとRubin Ultra AI GPUを発表、ファインマン・アーキテクチャを発表".2025. https://www.techpowerup.com/334334/nvidia-unveils-vera-cpu-and-rubin-ultra-ai-gpu-announces-feynman-architecture.
⁶ CNBC."Nvidia、Blackwell UltraとVera RubinのAIチップを発表".2025年3月18日。 https://www.cnbc.com/2025/03/18/nvidia-announces-blackwell-ultra-and-vera-rubin-ai-chips-.html.
Yahoo Finance."Nvidia、GTC 2025で次世代スーパーチップ「Vera Rubin」を初披露".2025年3月18日。 https://finance.yahoo.com/news/nvidia-debuts-next-generation-vera-rubin-superchip-at-gtc-2025-184305222.html.
⁸ 次のプラットフォーム。"Nvidia、2028年までのGPUシステムロードマップを描く".2025年6月5日。 https://www.nextplatform.com/2025/03/19/nvidia-draws-gpu-system-roadmap-out-to-2028/.
⁹ SemiAnalysis."NVIDIA GTC 2025 - Built For Reasoning, Vera Rubin, Kyber, CPO, Dynamo Inference, Jensen Math, Feynman."2025年8月4日。 https://semianalysis.com/2025/03/19/nvidia-gtc-2025-built-for-reasoning-vera-rubin-kyber-cpo-dynamo-inference-jensen-math-feynman/.
NVIDIA Newsroom."NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference".
¹¹ 同上。
¹² Tom's Hardware."Nvidia、2026年にRubin GPU、2027年にRubin Ultraを発表、ロードマップにファインマンも追加".2025年3月18日。 https://www.tomshardware.com/pc-components/gpus/nvidia-announces-rubin-gpus-in-2026-rubin-ultra-in-2027-feynam-after.
新しいスタック"NVIDIA、次世代RubinおよびFeynmanアーキテクチャを発表、AIパワーの限界に挑む".2025年4月14日。 https://thenewstack.io/nvidia-unveils-next-gen-rubin-and-feynman-architectures-pushing-ai-power-limits/.
NVIDIA Newsroom."NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference".
¹⁵ Data Center Dynamics."NvidiaのRubin Ultra NVL576ラックは600kW、2027年後半に登場予定".2025年3月18日。 https://www.datacenterdynamics.com/en/news/nvidias-rubin-ultra-nvl576-rack-expected-to-be-600kw-coming-second-half-of-2027/.
¹⁶ Tom's Hardware."Nvidia、60万ワットのKyberラックとインフラを備えたRubin Ultraを披露、2027年に登場"2025年3月19日。 https://www.tomshardware.com/pc-components/gpus/nvidia-shows-off-rubin-ultra-with-600-000-watt-kyber-racks-and-infrastructure-coming-in-2027.
¹⁷ Data Center Dynamics."GTC:Nvidiaのジェンセン・フアン、イアン・バック、チャーリー・ボイルがデータセンターのラック密度の将来について語る。"
⁸ Data Center Frontier."CoolITとAccelsius、ラック高密度化でデータセンター液冷の限界に挑戦".2025. https://www.datacenterfrontier.com/cooling/article/55281394/coolit-and-accelsius-push-data-center-liquid-cooling-limits-amid-soaring-rack-densities.
¹⁹ Data Center Dynamics."GTC:Nvidiaのジェンセン・フアン、イアン・バック、チャーリー・ボイルがデータセンターのラック密度の将来について語る。"
² ⁰ NVIDIAテクニカルブログ."NVIDIA 800 VDC アーキテクチャが次世代の AI ファクトリーを強化する".2025年5月20日. https://developer.nvidia.com/blog/nvidia-800-v-hvdc-architecture-will-power-the-next-generation-of-ai-factories/.
²¹ 同上。
²² 同上。
概要"カバーエリア"2025年アクセス。 https://introl.com/coverage-area.
NVIDIA Newsroom."NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference".
² ⁵ 同上。
²⁶ NVIDIAブログ."Blue Lion Supercomputer Will Run on NVIDIA Vera Rubin".2025年6月10日. https://blogs.nvidia.com/blog/blue-lion-vera-rubin/.
² ⁷ 同上。
NVIDIA Newsroom."NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference".
² ⁹ The Register.「Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks.".
グローバル・データセンター・ハブ.「Nvidia's 600kW Racks Are Here (Is Your Infrastructure Ready?)".2025年3月23日。 https://www.globaldatacenterhub.com/p/issue-8-nvidias-600kw-racks-are-hereis.
³¹ TechPowerUp."NVIDIA、Vera CPUとRubin Ultra AI GPUを発表、ファインマンアーキテクチャを発表".
データセンター・ダイナミクス"GTC:Nvidiaのジェンセン・フアン、イアン・バック、チャーリー・ボイルがデータセンターのラック密度の将来について語る。"