作者|苏子华 编辑|郑玄 最近两年,AI 行业最热的词一直绕不开「算力」。 从大模型训练,到今年 Agent 的火热,再到各家云厂商不断扩建智算中心,行业讨论最多的,几乎都是 GPU、芯片和算力规模。好像只要卡够多,AI 就能继续往前跑。 但现实并不是。 不少做大模型训练和推理的人,已经越来越明显地感受到另一层问题:机器越来越贵,GPU 越来越强,但模型训练和推理的效率,却没有同步提升。 问题不一定出在算力本身,而可能出在另一件长期被忽视的事情上——网力。 平头哥产品总监李旭慧打了个比方:「如果把算力比作 AI 时代的石油,网力就是输油管道。算力提供动力,网力保障效率。」 4 月 28 日,在数字中国建设峰会上,平头哥发布首款智能网卡磐脉 920。这是国内首个内置 PCIe Switch 的 400G 智能网卡,最大支持 400Gbps 吞吐带宽,可应用于万卡智算集群、通算集群和高性能存储等场景,目前已经量产,并将率先部署在阿里云数据中心。 磐脉 920 想要解决的就是「网力」问题。 今天的大模型训练,一个训练任务,往往需要几千甚至上
来源:极客公园-资讯

远见网
评论 抢沙发
围绕文章展开讨论,保持简洁、具体、可引用。