AI定价彻底分化,大模型只剩两种活法,中间的先死

一、AI肯定越来越便宜

1、AI肯定越来越便宜

过去大家总觉得，技术越普及，AI肯定越来越便宜。比如你看DeepSeek，API价格直接打到粉碎性骨折，几乎等于白给。

当你以为大家都要跟着大甩卖时，像Claude Fable 5这种头部的“前沿模型”反而开始疯狂涨价了，还有人抢着买单。

智谱甚至靠着提价，市值直接干到了1万亿。

这就很魔幻了。同样是卖智能，有人靠跳楼大甩卖，有人靠稀缺脑力疯狂收割利润，两拨人活在完全不同的两个世界里，却共用一个名字，叫大模型。

既然两极分化这么严重，那中间那些比上不足、比下有余的模型怎么办？

Altimeter Capital合伙人Freda Duan的判断一针见血：未来只有两种模型能活下来，要么足够出色，要么非常便宜。

而DeepSeek，就是那条横在所有人面前的“生死线”。

2、很多人对大模型价格有一个基本判断

过去两年，很多人对大模型价格有一个基本判断：模型会越来越便宜。

当模型能力被证明可以复制，后来者就会迅速把价格打下来。这就是所谓的“成熟智能通缩”。

DeepSeek就是这个故事的典型代表。2026年5月，V4-Pro模型API价格直接打到原价的四分之一。

API输入缓存命中降至0.025元/百万Tokens，输出6元/百万Tokens。

Claude Fable 5是最典型的例子。上一代Opus 4.8，价格是输入5美元、输出25美元。

到了Fable 5，价格直接翻倍，输入10美元、输出50美元。

GLM-5.2也是一样。

相比上一代，它的加权平均API价格高出了13%，甚至是Kimi K2.7-Code的1.2倍，DeepSeek V4-Pro的4.9倍。

二、单任务成本从GLM-5.1的约0.25美元升

1、它每个任务平均输出4.3万个toke

因为GLM-5.2更像一个长推理、长上下文、长链路Agent模型。

Artificial Analysis的测试显示，它每个任务平均输出4.3万个token，明显高于GLM-5.1的2.6万个。

所以，单任务成本从GLM-5.1的约0.25美元升到GLM-5.2的约0.46美元。

也就是说，哪怕名义单价没有大幅变化，实际跑一次复杂任务的钱也在变贵。

原因也很简单，当一个模型真的比其他模型更聪明，能解决更复杂的问题，能减少重试、减少人工介入、完成更长链路的任务，它就拿到了token的定价权。

这也是智谱在三天内股价翻倍的重要原因。

成熟智能陷入通缩：赚取的是模型规模化应用的钱，依赖极低的边际成本吃透流量红利。

前沿能力走向溢价：赚的是绝对定价权的钱，依靠稀缺的复杂任务处理能力拿到高毛利。

这种分红背后，还藏着一个AI与传统互联网在单位经济模型（Unit Economics）上的根本差异：客单价（ARPU）的无上限性。

互联网时代，单客价值往往存在明确的天花板，但在AI时代，一个深度用户每天可以消耗上亿Token。

以Claude Code为例，头部10% 的超级用户贡献了80% 到90% 的营收，呈现出极其极端的幂律分。

2、“使用深度”比“渗透率”有着更为庞大

这意味着，“使用深度”比“渗透率”有着更为庞大的商业潜力。

在这个逻辑下，DeepSeek实际上划定了整个行业的“生死线”。

如果一个模型只比DeepSeek强一点，但价格贵很多，它就没有长期存在的理由。

对于企业和开发者而言，为微弱的能力溢价支付不成比例的成本，显然不符合基本的商业常识。

三、通过智能路由进行任务的精准拆分：将最高价值

1、通过智能路由进行任务的精准拆分：将最

当缺乏核心壁垒的中间层模型被加速出清，大模型市场的运作机制正在不可逆地向“路由系统（Routing System）”演进。

企业开始通过智能路由进行任务的精准拆分：将最高价值的复杂推理交由前沿模型，将海量基础任务交由高性价比模型，从而实现单位成本下的产出最大化。

正如加文·贝克（Gavin Baker）所描述的产业终局：“前沿模型攫取了90% 的经济价值，而开源与廉价模型承载了80% 的Token消耗。”

这种路由机制的存在，就是中美AI竞争最底层的逻辑。

中国AI对海外生态的挤压，未必表现为中国模型公司在前台直接击溃美国巨头，而是一场更为隐秘的“底层平替”。

越来越多的美国AI应用公司，为了压降履约成本，开始将底层基础设施悄悄切换为Kimi、Qwen或DeepSeek，再于前台封装自身的产品体验与工作流。

用户表面上还在用Cursor，但底层某一部分调用量，已经悄悄从OpenAI和Anthropic切到了更便宜的模型。

2、这种混合路由方案在部分复杂的法律场景

法律AI独角兽Harvey已经完美验证了这一趋势。

它没有简单调用最贵的闭源模型，而是基于自己的法律数据，对开源模型做强化学习和监督微调，再通过路由器把不同任务分配给不同模型。

测试表明，这种混合路由方案在部分复杂的法律场景中，不仅性能足以超越Opus 4.7或4.8，还实现了更低的成本。

这很有可能就是AI应用公司未来的终极形态：底层接入各大API，前台包上自己的数据和工作流，中间靠路由赚差价。

Freda Duan对前沿模型很乐观。她认为，对前沿智能的需求永远不会被完全满足。只要任务足够复杂，人类就会继续为更强的智能付费。

但反对者的逻辑也很简单，美国高端模型如果要贵一百倍，就必须证明自己在目标任务上能创造远超一百倍的价值。

对少数高端任务，这个溢价也许能成立。对大多数普通任务，很难长期成立。

一旦用户习惯了高性价比的“智能路由”，高端模型就不再天然拥有所有流量。它们只能在最难、最骨感的金字塔尖里争夺那一点点市场份额。

四、任何行业出现这种高毛利都会吸引激烈的竞争

1、任何行业出现这种高毛利都会吸引激烈

而回顾历史，任何行业出现这种高毛利都会吸引激烈的竞争。两年前，Google DeepMind内部曾经流出过一句话：

“We don’t have a defending moat, neither does OpenAI。”

翻译过来就是，我们没有护城河，OpenAI也没有。这句话到今天似乎仍然成立。

在这波coding为核心产品周期里，Anthropic在商业化层面完成了对OpenAI的反超。

过去两年，谷歌的连续起伏也在证明着这一点。2025年以前，它在硅谷叙事里还是一个充满“中年危机”的角色。

被挑战，组织被质疑，AI发布会翻车，外界一度觉得它错过了这一轮。

但到了去年，Gemini 3横扫各大榜单，Nano Banana Pro把AI生图的精度和想象力推到了一个新高度。

2、Gemini应用月活跃用户突破6.5

去年三季度，Gemini应用月活跃用户突破6.5亿，相比上一季度的4.5亿大幅提升。

但现在，新的担忧又出现了。

谷歌不仅缺席了coding这波最重要的产品周期，Noam Shazeer和John Jumper等核心人才也连续离职，再次让市场重新担心它在大模型领域的优势。

大模型的故事讲到最后，其实已经被折叠成了一条铁律：要么足够极致，要么足够便宜。

前沿模型必须死守智力的高地，持续用无可替代的性能赚取绝对的定价权；而廉价模型则会淹没下沉的汪洋，靠极致的性价比吃透规模化的流量。

至于那些卡在中间、比上不足比下有余的模型，注定会在无处不在的“智能路由”中被彻底绞杀，最终被清出牌桌。

今年年初，硅谷创投教父纳瓦尔在一档播客里说了句极其扎心的话：在AI时代，平庸的人没有市场，“绝对细分”才是唯一的活路。

一、AI肯定越来越便宜

1、AI肯定越来越便宜

2、很多人对大模型价格有一个基本判断

二、单任务成本从GLM-5.1的约0.25美元升

1、它每个任务平均输出4.3万个toke

2、“使用深度”比“渗透率”有着更为庞大

三、通过智能路由进行任务的精准拆分：将最高价值

1、通过智能路由进行任务的精准拆分：将最

2、这种混合路由方案在部分复杂的法律场景

四、任何行业出现这种高毛利都会吸引激烈的竞争

1、任何行业出现这种高毛利都会吸引激烈

2、Gemini应用月活跃用户突破6.5

相关推荐

热门文章

热门标签

支持本站持续更新

如果这篇内容对你有帮助，欢迎扫码支持。

支付宝扫一扫

微信扫一扫

切换注册登录

切换登录注册