8 月 23 日消息,hot chips 大会将于 8 月 24~26 日举行,英伟达宣布推出 nvidia spectrum-xgs ethernet 技术,即日起作为 nvidia spectrum-x 以太网平台的一部分提供。
这是一项面向分布式数据中心的跨域互联技术,旨在将多个不同区域的独立数据中心连接到一起,打造成一个具备千亿级计算能力的 ai 超级工厂。
英伟达介绍称,随着 ai 需求的快速增长,单一数据中心在电力和容量上逐渐触及极限。传统以太网在延迟、抖动和性能一致性方面的局限,使得数据中心无法轻易突破单一设施的边界。spectrum-xgs ethernet 正是为此设计,它引入了跨域扩展架构,具备自适应的网络算法,可根据数据中心之间的距离进行动态调整:
自适应距离拥塞控制:动态优化数据中心间网络传输
精准延迟管理:将 nccl 通信库性能提升了几乎一倍
端到端遥测系统:保障地理分散集群的可预测性能
黄仁勋表示:“ai 产业革命已经到来,而超大规模的 ai 工厂正是关键基础设施。通过 spectrum-xgs ethernet,我们在纵向扩展和横向扩展的基础上增加了跨域扩展能力,将分布在城市、国家乃至洲际的数据中心连接成庞大的千亿级 ai 超级工厂。”
据介绍,云服务商 coreweave 已率先采用 spectrum-xgs ethernet。该公司联合创始人兼首席技术官 peter salanki 表示“该技术可将我们的数据中心整合为统一超级计算机”。
在此之前,英伟达已推出 spectrum-x 交换机和 connectx-8 supernic,用于跨站点连接数百万 gpu,同时降低能耗和运营成本。