咱们中国企业这次在开源医疗大模型方面取得了全球评测的突破,AI把严肃医疗问诊推上了一个新高度。在AI技术不断向各个行业渗透的时候,中国的科技公司在医疗健康领域也一直在搞创新。最近,北京百川智能科技有限公司把他们自主研发的新一代医疗大模型Baichuan-M3给全面开源了。这个动作不仅给全球医疗AI研究社区提供了重要资源,还因为它在多项国际权威评测里表现得特别好而引起了关注。 HealthBench是一个评估医疗AI性能的国际基准,它专门测试模型的医学知识广度、诊断推理深度和临床实践贴合度,所以业界都把它当成衡量医疗AI核心能力的尺子。Baichuan-M3在这个评测体系里得了65.1分,排在全球第一。特别是在HealthBench Hard子项评测里,Baichuan-M3也以44.4分的高分拿下了冠军。这种双项第一的成绩说明咱们国家在医疗大模型技术上已经具备了国际竞争力。 Baichuan-M3和之前那些只能回答简单问题的医疗助手不一样,它被设计成具备真正的“端到端”问诊能力。面对患者的症状描述时,模型能像真正的医生一样思考和提问。比如患者说自己胸痛,模型就会系统性地询问疼痛的性质、部位、持续时间、有没有缓解因素以及伴随症状等等,把所有信息都整合起来形成一幅临床图像。然后它再进行深入的分析和判断,给出有价值的建议。这种主动获取信息再分析判断的模式是AI向临床辅助工具发展的关键一步。 百川智能把Baichuan-M3开源出来的同时,他们旗下的“百小应”应用也接入了这个模型最新的能力,开始给医生和患者提供服务了。医生用这个工具可以快速梳理患者的情况提示诊断方向;患者用这个工具可以得到更专业的健康咨询和就医指导。 这次Baichuan-M3开源和应用落地结合起来形成了一个良性循环:技术研发出来后社区反馈意见帮助迭代应用。 现在AI已经改变了很多医疗健康服务的形态:医学影像分析、药物研发、辅助诊断和健康管理等等都在应用AI技术。但是医疗领域有很高的专业性和复杂性还有严肃性,对AI模型要求也特别高:准确性、可靠性、可解释性还有伦理合规性都需要做到位。 咱们国家在“十四五”规划里也给人工智能赋能医疗卫生事业做了部署。百川智能这次在医疗大模型上取得领先成绩是响应国家战略为人民健康服务的具体体现。 展望未来我们希望产学研医各界能一起研究怎么让医疗AI更安全更可靠怎么更好地融入医疗卫生体系助力建设健康中国提高全民健康福祉。