6月22日,百川智能正式发布新一代医疗增强大模型Baichuan-M4(以下简称M4)。
这款模型在HealthBench医疗评测中斩获主榜单及Hard、Professional子榜单榜首,展现出超越GPT-5.5的医疗专业能力。
M4的核心进化在于交互模式的根本变革——它不再是被动等待用户提问的问答工具,而是能够模拟真人医生的诊疗逻辑,主动追问、整合病史,并给出循证结论。
这一发布正值大模型行业从通用能力竞赛向垂直场景深耕转型的关键节点。
此前,豆包大模型日均tokens调用量已突破180万亿,字节跳动CEO梁汝波在火山引擎Force大会上将年度关键词定为“勇攀高峰”,强调聚焦提升大模型核心能力。
但通用模型的规模化增长背后,医疗等专业领域的落地仍面临准确性和可信度的严峻挑战。
百川智能M4的推出,恰好回应了这一行业痛点。
从被动应答到主动问诊:交互模式的重构
传统AI问诊系统大多基于静态知识库,用户输入症状后,模型返回一个预设的答案。
这种模式最大的缺陷在于无法像真人医生那样通过追问来缩小诊断范围。
M4模型则引入了主动追问能力,能够根据患者的主诉,自动生成一系列逻辑递进的问题,就像一位经验丰富的医生在门诊中不断追问“疼痛持续多久了?
”“有没有伴随发热?”一样。
这种交互模式变革的背后,是模型对医疗诊疗逻辑的深度理解。
百川智能团队在模型训练中引入了大量真实的医患对话数据和临床决策路径,让模型学会在信息不完整的情况下主动寻求关键线索。
例如,当用户描述“头痛”时,M4不会直接给出偏头痛或紧张性头痛的结论,而是先询问头痛的部位、性质、持续时间以及是否伴有恶心、畏光等症状,逐步逼近真实病因。
更重要的是,M4还推出了“全病程记忆”功能。
它可以深度整合患者的历史就诊记录、用药史、检查报告等长上下文信息,并在后续问诊中自动调用。
这意味着,如果一位慢性病患者多次使用M4咨询,模型能够记住之前的病情演变和治疗反应,避免重复问诊,也减少了遗漏关键病史的风险。
官方数据显示,M4的长上下文临床记忆性能较上一代模型提升了显著幅度。
这一能力在现实医疗场景中尤为重要。
很多基层医生在面对复诊患者时,往往需要翻阅纸质病历或询问患者“上次吃的什么药”,而M4的全病程记忆相当于为每位患者建立了一个动态更新的数字化健康档案,让AI问诊具备了连续性和一致性。
循证医学的落地:证据锚定与引用精度
医疗AI最核心的挑战之一是如何保证输出的结论有据可查。
通用大模型虽然能生成流畅的医疗建议,但往往无法明确指出结论的出处,导致医生和患者难以判断其可靠性。
M4模型引入的“证据锚定”技术,试图解决这一信任难题。
所谓“证据锚定”,是指模型在给出医学结论时,能够精确对应到权威医学论文或临床指南的具体段落。
官方数据显示,M4的循证引用精度达到90.0,大幅领先同类大模型。
这意味着,当M4建议某种治疗方案时,它不仅能说出“根据2025年《中国高血压防治指南》”,还能直接定位到指南中关于该方案的具体推荐级别和证据等级。
这一技术路径借鉴了循证医学的核心原则——任何临床决策都应有最佳证据支持。
对于医疗资源稀缺地区的医生而言,M4的循证能力相当于一个随时在线的“专家顾问团”。
他们可以在M4的辅助下,快速查阅最新的临床指南和研究文献,减少因信息滞后或知识盲区导致的误诊。
这有望缓解分级诊疗中基层医生能力不足的困境,让优质医疗资源通过AI下沉到县乡一级。
但“证据锚定”并非完美无缺。
医学知识更新速度极快,模型引用的论文和指南是否是最新版本,以及模型在引用过程中是否存在断章取义的风险,仍需要持续验证。
百川智能表示,M4的医学知识库会定期更新,并引入了人工审核机制,但实际使用中的表现仍需更多临床测试来检验。
产业影响:AI医疗从工具走向伙伴
M4的发布标志着大模型在医疗领域的应用从“知识储备”向“诊疗决策支持”跨越。
过去,AI在医疗行业的主要角色是辅助信息检索,比如帮医生快速查找文献或药物信息。
而M4具备了主动问诊、全病程管理和循证推理能力,使其能够深度参与到诊疗决策的链条中,成为医生的“数字搭档”。
这种角色转变对医疗行业的智能化转型意义深远。
中国医疗行业长期面临四大痛点:优质医疗资源分布不均、基层诊疗能力薄弱、医生工作负荷过重、患者就医体验差。
M4的主动问诊和全病程记忆功能,可以直接应用于在线问诊平台和医院导诊系统,分流轻症患者,减轻医生的重复劳动。
同时,其循证能力也能帮助基层医生在复杂病例中做出更准确的判断,提升基层首诊的可靠性。
从商业模式看,M4的发布为百川智能在AI医疗赛道构建了差异化优势。
当前,大模型行业价格战激烈,通用API调用费持续走低,豆包大模型日均调用量虽达180万亿,但其背后的算力成本高达数千万元,商业化压力巨大。
而百川智能聚焦医疗这一高附加值垂直领域,通过专业能力建立护城河,有望获得更高的客单价和更稳定的客户粘性。
但挑战同样存在。医疗AI的监管门槛极高,M4作为“诊疗决策支持”工具,需要获得医疗器械注册证才能进入临床使用。
目前,国内尚未有完全基于大模型的AI诊疗系统获批,百川智能需要与监管机构密切沟通,推动审批流程。
此外,医疗数据的隐私保护也是一个敏感问题,全病程记忆功能涉及大量患者个人信息,如何确保数据安全合规,是M4大规模商用的前提。
竞争格局与行业展望
百川智能并非AI医疗赛道的唯一玩家。
百度灵医、腾讯觅影、科大讯飞医疗等产品早已布局,但大多聚焦于医学影像识别、语音电子病历等细分场景。
M4的差异化在于“主动问诊+全病程管理+循证引用”三位一体的能力组合,试图覆盖诊断前、中、后的全链条。
如果这一模式被验证可行,可能倒逼其他厂商加快从“单点工具”向“全流程伙伴”的转型。
值得注意的是,大模型行业的竞争焦点正在从参数规模转向落地效果。
字节跳动CEO梁汝波强调“勇攀高峰”,核心是提升模型在各行各业的实际应用价值。
百川智能M4在医疗领域的突破,正是这一趋势的缩影。
当通用大模型陷入同质化竞争时,垂直领域的深度定制和场景化创新,可能成为后来者弯道超车的关键。
从更宏观的视角看,M4的出现也为AI医疗普惠化提供了新的范本。
中国有超过14亿人口,但优质医疗资源高度集中于一二线城市的三甲医院。
如果AI问诊系统能够达到甚至接近真人医生的诊断准确率,并能够大规模部署到社区卫生中心和乡村诊所,那么“让精准医疗触手可及”就不再是一句口号。
当然,这需要技术、政策和基础设施的协同推进,但M4至少迈出了从0到1的关键一步。
百川智能M4模型的发布,不仅是一次技术迭代,更是一次医疗AI交互范式的重构。
它让大模型从“知道很多”进化为“会问会想”,从知识库升级为诊疗伙伴。
对于整个AI行业而言,这一案例证明:在垂直领域深耕,用技术解决真实痛点,比盲目追求通用参数更有商业价值。
未来,随着M4在真实医疗场景中的落地验证,AI医疗的想象空间将被进一步打开。
这意味着,百川智能M4模型突破主动问诊后面真正要看的,已经不是单点产品热度还能不能继续放大,而是客户验证、交付效率和供应链稳定性会不会连续改善。只有这些变量开始稳定兑现,这轮变化才会从阶段性信号走向更明确的趋势。
长期看,对平台企业与供应链厂商来说,竞争差距不会停留在表态或热度上,而会先体现在客户验证和交付效率能不能沉到日常动作里。谁能把这些环节持续做实,谁才更有机会把百川智能M4模型突破主动问诊留在结果上。

远见网
