甲骨文与NVIDIA携手,在云端AI超级计算机竞赛中投下了一枚“重磅炸弹”。
在近日举行的甲骨文全球AI大会上,甲骨文正式推出了新一代云端AI超级计算机Oracle Cloud Infrastructure(OCI)Zettascale10。
这款被官方称为“云端最大AI超级计算机”的系统,通过跨数据中心连接数十万颗NVIDIA GPU,形成多千兆瓦级集群,峰值性能可达16 ZettaFLOPS,为大规模AI训练与高性能计算提供了突破性基础设施支撑。
01 技术架构:突破算力边界
OCI Zettascale10并非简单的硬件堆砌,其核心优势源于创新的网络架构设计。
该平台基于下一代Oracle Acceleron RoCE网络架构,实现了跨数据中心的GPU集群低延迟互联。
这种设计可在集群内达成“微秒级”GPU间通信延迟,较传统架构大幅提升数据传输效率。
甲骨文云基础设施执行副总裁Mahesh Thiagarajan表示:
“通过OCI Zettascale10,我们将OCI突破性的Oracle Acceleron RoCE网络架构与下一代NVIDIA AI基础设施融合,以提供千兆瓦级AI容量及无与伦比的规模。”
平台通过直接绕过CPU进行GPU间数据交互,显著降低计算瓶颈,为训练万亿参数级大模型提供了高效算力底座。
02 规模与性能:重新定义云端算力
硬件层面,OCI Zettascale10支持将数百个数据中心的NVIDIA GPU资源进行动态整合,构建起逻辑统一的超级计算集群。
官方数据显示,单集群峰值性能可达16 ZettaFLOPS——即每秒16万亿亿次计算。
这一算力规模足以同时处理超大规模AI训练任务。
例如,支持数万个并行运行的生成式AI模型实时推理,或加速生物医药领域的蛋白质结构预测等复杂计算。
OCI Zettascale10是去年9月推出的第一代Zettascale云计算集群的强大演进。
新一代集群安装在大型千兆瓦级数据中心园区内,这些园区在两公里半径内为密度进行了超优化,为大规模AI训练工作负载提供最佳的GPU到GPU延迟。
03 生态合作:支撑OpenAI旗舰超算
OCI Zettascale10不仅是技术平台,更是甲骨文生态战略的核心载体。
作为今年初启动的 “星门”(Stargate)计划核心载体,OCI Zettascale10将为甲骨文与OpenAI在得克萨斯州阿比林共建的旗舰超级集群提供底层架构支持。
OpenAI基础设施与工业计算副总裁Peter Hoeschele证实:
“OCI Zettascale10网络和集群架构首先在德克萨斯州阿比林的旗舰Stargate站点开发和部署——这是我们与Oracle的联合超级集群。”
平台的高可靠性与弹性扩展能力,恰好匹配OpenAI对下一代AI模型训练的苛刻需求。
其设计可确保集群利用率提升30%以上,同时通过分布式故障恢复机制,将大规模训练任务的中断风险降至行业最低水平。
04 商业应用:重塑行业AI格局
面对全球企业AI基础设施支出从2024年约600亿美元迅猛增至2026年2300亿美元的趋势,OCI Zettascale10的推出标志着甲骨文在云端算力竞赛中确立差异化优势。
Forrester分析师Tracy Woo指出,甲骨文通过深度整合NVIDIA AI基础设施与自身网络技术,打造出“行业领先的性价比算力方案”。
其每FLOPS成本较同类产品降低20%以上,有效缓解企业面临的AI算力成本压力。
Gartner数据显示,未来三年42%的企业将把超过30%的云预算投入生成式AI。
Zettascale10的超大规模并行计算能力,恰好满足这类高密度算力需求。
例如,某智能制造企业通过该平台进行工业级AI质检模型训练,将缺陷识别准确率提升至99.8%的同时,训练周期缩短40%,显著加速了AI在生产场景的落地效率。
05 未来规划:算力即服务的新篇章
根据甲骨文规划,OCI Zettascale10将于2026年下半年正式向客户开放服务,首批用户可调用包含80万个NVIDIA GPU的超算集群资源。
平台已支持主流AI开发框架如PyTorch、TensorFlow的无缝接入,并提供自动化集群管理工具,帮助企业实现从模型训练到生产部署的全链路优化。
值得关注的是,Zettascale10的网络架构设计具备技术中立性,未来可兼容更多厂商的算力芯片,为客户提供多元化选择空间。
这种“以网络为中心”的算力整合模式,被业内视为应对全球算力供应链波动的关键策略。
即使单一芯片产能受限,平台仍可通过资源调度保持稳定服务。
16 ZettaFLOPS的算力规模不仅是一个数字里程碑,更重新定义了云端AI基础设施的技术标准。
随着OCI Zettascale10在2026年下半年正式向客户开放,企业获取尖端算力的门槛将大幅降低。
从训练万亿参数大模型到加速科学发现,从降低成本壁垒到满足数据主权,这场由甲骨文引领的“算力民主化”浪潮,可能才刚刚开始。