远见中国
未来经济坐标系

英伟达AMD英特尔博通联手,堵上GPU算力浪费的漏洞

芯东西5月7日消息,昨日晚间,OpenAI与AMD、博通、英特尔、微软、英伟达联合发布全新开放网络协议MRC(多路径可靠连接),可帮助大型AI训练集群更快、更可靠地运行。OpenAI通过开放计算项目(OCP)发布了MRC。 MRC已部署在OpenAI所有用于训练前沿模型的超级计算机上,包括位于美国德克萨斯州阿比林的美国甲骨文云基础设施(OCI)站点,以及微软Fairwater超级计算机等。 MRC是一种内置于最新800Gb/s网络接口中的新网络协议,可将单次数据传输分流至数百条路径、微秒级绕开故障链路,同时还能简化网络控制面架构。  OpenAI官方博客提到,近期为ChatGPT与Codex训练一款前沿大模型时,他们不得不重启四台一级核心交换机,以往重启交换机需运维团队极度谨慎,引入MRC之后,他们甚至无需与集群训练任务的运维团队提前协调就可重启。  在打造基建项目Stargate之前,OpenAI已与合作伙伴在几年间开发并维护了前三代超级计算机,这使其认识到要在超级计算机上高效利用算力并成功完成任务,需要大幅降低堆栈每一层的复杂性,包括重新设计网络。 

查看原文 →

(来源:36氪-资讯,2026-05-07)

赞(0) 打赏
未经允许不得转载:远见网 » 英伟达AMD英特尔博通联手,堵上GPU算力浪费的漏洞
分享到
讨论区

评论 抢沙发

围绕文章展开讨论,保持简洁、具体、可引用。

远见网

全新产业投资平台

登录

找回密码

注册

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫