【北大与DeepSeek联合开源DSpark框架,高并发下生成速度提升超60%】

钛媒体App 6月27日消息,DeepSeek联合北京大学正式发布DSpark推理加速框架,旨在解决大语言模型在高并发生产环境中的推理效率瓶颈。

该框架已部署于DeepSeek-V4-Flash与DeepSeek-V4-Pro的预览版服务引擎中,相比此前生产环境采用的单token推测解码基线MTP-1,在同等吞吐量水平下可将单用户生成速度提升60%至85%。

相关论文、训练代码及模型检查点已在GitHub平台DeepSpec项目中开源。

来源: 钛媒体-快讯
产业标签 AI中国/大模型与AI Agent
赞(1) 支持本站
分享到

支持本站持续更新

如果这篇内容对你有帮助,欢迎扫码支持。

支付宝扫一扫

微信扫一扫

登录

找回密码

注册