远见中国

13人干翻Transformer,新架构SSA算力暴减千倍,成本仅Opus 5%

Transformer统治地位悬了!一款SubQ模型带着SAA架构横空出世,1200万上下文成本仅Opus的5%,计算量暴减千倍。 Transformer,王座不保?! 今天,一款AI模型SubQ横空出世,震撼了全世界。 这是全球首个基于完全亚二次方稀疏注意力架构(SSA)的模型,上下文高达1200万Token。 SubQ的核心优势在于,其SSA架构会根据内容「动态选择」关注点,不会盲目计算所有Token间的关联。 相较于Transformer,它的计算量直接暴减1000倍。 实验结果显示,100万token上下文,SubQ要比FlashAttention快52倍,成本不到Claude Opus的5%。 而打造出这款架构的背后这家公司,叫Subquadratic,坐标迈阿密,全公司仅13人。 AI大佬Bindu Reddy辣评道,「若这一切都是真的,Anthropic和OpenAI的估值直接归0」! 还有人表示,这才是LLM接下来真正Scaling的方式。 Transformer「原罪」,九年未解 2017年,谷歌那篇「Attention is All You Need」奠定了Tran

查看原文 →

(来源:36氪深度,2026-05-06)

把这条线索转化为下一步行动

进入远见OS,将产业信息、政策机会、资本动态或项目线索转化为融资材料、投资判断、项目 Pipeline 或 FA 交易流程。

赞(0) 打赏
未经允许不得转载:远见网 » 13人干翻Transformer,新架构SSA算力暴减千倍,成本仅Opus 5%
分享到

评论 抢沙发

远见网

全新产业投资平台

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

登录

找回密码

注册