Transformer统治地位悬了!一款SubQ模型带着SAA架构横空出世,1200万上下文成本仅Opus的5%,计算量暴减千倍。 Transformer,王座不保?! 今天,一款AI模型SubQ横空出世,震撼了全世界。 这是全球首个基于完全亚二次方稀疏注意力架构(SSA)的模型,上下文高达1200万Token。 SubQ的核心优势在于,其SSA架构会根据内容「动态选择」关注点,不会盲目计算所有Token间的关联。 相较于Transformer,它的计算量直接暴减1000倍。 实验结果显示,100万token上下文,SubQ要比FlashAttention快52倍,成本不到Claude Opus的5%。 而打造出这款架构的背后这家公司,叫Subquadratic,坐标迈阿密,全公司仅13人。 AI大佬Bindu Reddy辣评道,「若这一切都是真的,Anthropic和OpenAI的估值直接归0」! 还有人表示,这才是LLM接下来真正Scaling的方式。 Transformer「原罪」,九年未解 2017年,谷歌那篇「Attention is All You Need」奠定了Tran
(来源:36氪深度,2026-05-06)

远见网








