(问题)医疗领域专业性强、风险高,智能工具要进入临床一线,首先要过“可信”关。
近年来,大模型能力快速提升,自我健康咨询等场景使用增多,但医疗回答一旦出现事实偏差或“凭空编造”,不仅影响公众判断,更会放大医生对相关产品的审慎态度。
业内普遍认为,降低幻觉率、建立可追溯的证据链,是医疗智能应用走向临床辅助决策的前置条件之一。
(原因)一方面,医疗信息高度结构化且更新频繁,指南、药品说明、循证研究对结论的适用人群与边界有严格要求;另一方面,临床工作节奏快、责任链条清晰,医生对工具的要求不仅是“给出答案”,更要“说清依据”。
与部分国家相比,我国医疗从业者工作负荷较重,数字化工具的学习与磨合成本更为敏感;同时,行业对新技术的评测、披露与共识形成仍在完善阶段,客观上也影响了新产品的信任建立与扩散速度。
(影响)在此背景下,百川智能发布新一代医疗大模型Baichuan-M3 Plus,并将“可验证、可被信任、可被使用”作为对外展示重点。
据公司披露,该模型在严肃医疗问答中的事实性幻觉率降至2.6%,并在既有评测基础上进一步强调稳定性与可用性。
更受关注的是其提出的“证据锚定”路径:模型输出的每一句医学结论需与论文或指南中的具体证据段落精确对应,使使用者不仅看到来源,还能定位到原文位置,从而便于快速核对与二次判断。
公司称,在训练环节引入独立的引用奖励机制,对不匹配引用进行惩罚,结论与证据段落匹配准确率超过95%。
这一做法意在把“参考文献列表”升级为“可定位的证据片段”,让临床场景的核验成本更低、证据链更清晰。
(对策)除可信与核验外,成本同样决定普及速度。
医疗场景的高频使用通常发生在临床辅助、医学教学、病例讨论等环节,调用成本过高将直接抬升机构的试用门槛与持续使用门槛。
百川智能表示,M3 Plus通过架构优化、量化与推理加速等工程手段,使API调用成本较上一代下降约70%。
与此同时,公司推出“海纳百川”计划,将模型以API形式向国内医疗服务机构免费开放,使用范围限定在临床辅助决策与医学教育。
公司负责人提出,如果覆盖到大规模临床医生使用,年度成本约在1亿元量级,并认为相对于潜在的效率提升与质量改进,这一投入具有可接受性。
业内人士指出,面向机构端的接口开放与成本下探,有利于更多医院在可控风险和合规边界内开展试点,推动从“少数场景试用”转向“流程化嵌入”。
(前景)从产业趋势看,大模型企业正从“通用能力竞赛”转向“垂直场景落地”,医疗因其明确的需求、可量化的质量指标与广阔的服务空间,成为重要方向。
但需要看到,医疗智能应用的推广并非单一模型能力即可解决,还涉及数据治理、知识更新机制、临床路径适配、责任边界与合规审查等系统工程。
未来一段时期,行业竞争的关键或将从“能否回答”转为“能否稳定、可追溯、可审计地辅助”,以及能否在真实世界使用中形成持续迭代的闭环。
随着证据链式输出、标准化评测与机构侧试点增多,医疗智能工具有望更多进入教学培训、规范化诊疗提示、药物信息检索、文书辅助等相对低风险环节,并逐步向更复杂的临床决策支持拓展。
医疗AI的普及不仅关乎技术创新,更是一场关于信任与效率的行业变革。
百川智能的尝试展现了技术企业推动社会价值实现的可能路径,而这一进程的成功,最终将取决于技术、成本与需求的三重契合。
在数字化医疗的时代浪潮中,中国能否走出一条特色发展之路,值得持续关注。