13人干翻Transformer，新架构SSA算力暴减千倍，成本仅Opus 5%

Transformer统治地位悬了！一款SubQ模型带着SAA架构横空出世，1200万上下文成本仅Opus的5%，计算量暴减千倍。 Transformer，王座不保？！今天，一款AI模型SubQ横空出世，震撼了全世界。这是全球首个基于完全亚二次方稀疏注意力架构（SSA）的模型，上下文高达1200万Token。 SubQ的核心优势在于，其SSA架构会根据内容「动态选择」关注点，不会盲目计算所有Token间的关联。相较于Transformer，它的计算量直接暴减1000倍。实验结果显示，100万token上下文，SubQ要比FlashAttention快52倍，成本不到Claude Opus的5%。而打造出这款架构的背后这家公司，叫Subquadratic，坐标迈阿密，全公司仅13人。 AI大佬Bindu Reddy辣评道，「若这一切都是真的，Anthropic和OpenAI的估值直接归0」！还有人表示，这才是LLM接下来真正Scaling的方式。 Transformer「原罪」，九年未解 2017年，谷歌那篇「Attention is All You Need」奠定了Tran

查看原文 →

（来源：36氪深度，2026-05-06）