AI定价彻底分化,大模型只剩两种活法,中间的先死

一、AI肯定越来越便宜

1、AI肯定越来越便宜

过去大家总觉得,技术越普及,AI肯定越来越便宜。比如你看DeepSeek,API价格直接打到粉碎性骨折,几乎等于白给。

当你以为大家都要跟着大甩卖时,像Claude Fable 5这种头部的“前沿模型”反而开始疯狂涨价了,还有人抢着买单。

智谱甚至靠着提价,市值直接干到了1万亿。

这就很魔幻了。同样是卖智能,有人靠跳楼大甩卖,有人靠稀缺脑力疯狂收割利润,两拨人活在完全不同的两个世界里,却共用一个名字,叫大模型。

既然两极分化这么严重,那中间那些比上不足、比下有余的模型怎么办?

Altimeter Capital合伙人Freda Duan的判断一针见血:未来只有两种模型能活下来,要么足够出色,要么非常便宜。

而DeepSeek,就是那条横在所有人面前的“生死线”。

2、很多人对大模型价格有一个基本判断

过去两年,很多人对大模型价格有一个基本判断:模型会越来越便宜。

当模型能力被证明可以复制,后来者就会迅速把价格打下来。这就是所谓的“成熟智能通缩”。

DeepSeek就是这个故事的典型代表。2026年5月,V4-Pro模型API价格直接打到原价的四分之一。

API输入缓存命中降至0.025元/百万Tokens,输出6元/百万Tokens。

Claude Fable 5是最典型的例子。上一代Opus 4.8,价格是输入5美元、输出25美元。

到了Fable 5,价格直接翻倍,输入10美元、输出50美元。

GLM-5.2也是一样。

相比上一代,它的加权平均API价格高出了13%,甚至是Kimi K2.7-Code的1.2倍,DeepSeek V4-Pro的4.9倍。

二、单任务成本从GLM-5.1的约0.25美元升

1、它每个任务平均输出4.3万个toke

因为GLM-5.2更像一个长推理、长上下文、长链路Agent模型。

Artificial Analysis的测试显示,它每个任务平均输出4.3万个token,明显高于GLM-5.1的2.6万个。

所以,单任务成本从GLM-5.1的约0.25美元升到GLM-5.2的约0.46美元。

也就是说,哪怕名义单价没有大幅变化,实际跑一次复杂任务的钱也在变贵。

原因也很简单,当一个模型真的比其他模型更聪明,能解决更复杂的问题,能减少重试、减少人工介入、完成更长链路的任务,它就拿到了token的定价权。

这也是智谱在三天内股价翻倍的重要原因。

成熟智能陷入通缩:赚取的是模型规模化应用的钱,依赖极低的边际成本吃透流量红利。

前沿能力走向溢价:赚的是绝对定价权的钱,依靠稀缺的复杂任务处理能力拿到高毛利。

这种分红背后,还藏着一个AI与传统互联网在单位经济模型(Unit Economics)上的根本差异:客单价(ARPU)的无上限性。

互联网时代,单客价值往往存在明确的天花板,但在AI时代,一个深度用户每天可以消耗上亿Token。

以Claude Code为例,头部10% 的超级用户贡献了80% 到90% 的营收,呈现出极其极端的幂律分。

2、“使用深度”比“渗透率”有着更为庞大

这意味着,“使用深度”比“渗透率”有着更为庞大的商业潜力。

在这个逻辑下,DeepSeek实际上划定了整个行业的“生死线”。

如果一个模型只比DeepSeek强一点,但价格贵很多,它就没有长期存在的理由。

对于企业和开发者而言,为微弱的能力溢价支付不成比例的成本,显然不符合基本的商业常识。

三、通过智能路由进行任务的精准拆分:将最高价值

1、通过智能路由进行任务的精准拆分:将最

当缺乏核心壁垒的中间层模型被加速出清,大模型市场的运作机制正在不可逆地向“路由系统(Routing System)”演进。

企业开始通过智能路由进行任务的精准拆分:将最高价值的复杂推理交由前沿模型,将海量基础任务交由高性价比模型,从而实现单位成本下的产出最大化。

正如加文·贝克(Gavin Baker)所描述的产业终局:“前沿模型攫取了90% 的经济价值,而开源与廉价模型承载了80% 的Token消耗。”

这种路由机制的存在,就是中美AI竞争最底层的逻辑。

中国AI对海外生态的挤压,未必表现为中国模型公司在前台直接击溃美国巨头,而是一场更为隐秘的“底层平替”。

越来越多的美国AI应用公司,为了压降履约成本,开始将底层基础设施悄悄切换为Kimi、Qwen或DeepSeek,再于前台封装自身的产品体验与工作流。

用户表面上还在用Cursor,但底层某一部分调用量,已经悄悄从OpenAI和Anthropic切到了更便宜的模型。

2、这种混合路由方案在部分复杂的法律场景

法律AI独角兽Harvey已经完美验证了这一趋势。

它没有简单调用最贵的闭源模型,而是基于自己的法律数据,对开源模型做强化学习和监督微调,再通过路由器把不同任务分配给不同模型。

测试表明,这种混合路由方案在部分复杂的法律场景中,不仅性能足以超越Opus 4.7或4.8,还实现了更低的成本。

这很有可能就是AI应用公司未来的终极形态:底层接入各大API,前台包上自己的数据和工作流,中间靠路由赚差价。

Freda Duan对前沿模型很乐观。她认为,对前沿智能的需求永远不会被完全满足。只要任务足够复杂,人类就会继续为更强的智能付费。

但反对者的逻辑也很简单,美国高端模型如果要贵一百倍,就必须证明自己在目标任务上能创造远超一百倍的价值。

对少数高端任务,这个溢价也许能成立。对大多数普通任务,很难长期成立。

一旦用户习惯了高性价比的“智能路由”,高端模型就不再天然拥有所有流量。它们只能在最难、最骨感的金字塔尖里争夺那一点点市场份额。

四、任何行业出现这种高毛利都会吸引激烈的竞争

1、任何行业出现这种高毛利都会吸引激烈

而回顾历史,任何行业出现这种高毛利都会吸引激烈的竞争。两年前,Google DeepMind内部曾经流出过一句话:

“We don’t have a defending moat, neither does OpenAI。”

翻译过来就是,我们没有护城河,OpenAI也没有。这句话到今天似乎仍然成立。

在这波coding为核心产品周期里,Anthropic在商业化层面完成了对OpenAI的反超。

过去两年,谷歌的连续起伏也在证明着这一点。2025年以前,它在硅谷叙事里还是一个充满“中年危机”的角色。

被挑战,组织被质疑,AI发布会翻车,外界一度觉得它错过了这一轮。

但到了去年,Gemini 3横扫各大榜单,Nano Banana Pro把AI生图的精度和想象力推到了一个新高度。

2、Gemini应用月活跃用户突破6.5

去年三季度,Gemini应用月活跃用户突破6.5亿,相比上一季度的4.5亿大幅提升。

但现在,新的担忧又出现了。

谷歌不仅缺席了coding这波最重要的产品周期,Noam Shazeer和John Jumper等核心人才也连续离职,再次让市场重新担心它在大模型领域的优势。

大模型的故事讲到最后,其实已经被折叠成了一条铁律:要么足够极致,要么足够便宜。

前沿模型必须死守智力的高地,持续用无可替代的性能赚取绝对的定价权;而廉价模型则会淹没下沉的汪洋,靠极致的性价比吃透规模化的流量。

至于那些卡在中间、比上不足比下有余的模型,注定会在无处不在的“智能路由”中被彻底绞杀,最终被清出牌桌。

今年年初,硅谷创投教父纳瓦尔在一档播客里说了句极其扎心的话:在AI时代,平庸的人没有市场,“绝对细分”才是唯一的活路。

来源: 投中网-商业深度
产业标签 AI中国/大模型与AI Agent
赞(1) 支持本站
分享到

支持本站持续更新

如果这篇内容对你有帮助,欢迎扫码支持。

支付宝扫一扫

微信扫一扫

登录

找回密码

注册