,优先识别和排查危急重症,而不是被动等待用户提供完整信息,更不会为了尽快给出答案而跳过该问的关键病史。
百川智能介绍称,该公司借鉴医学教育中长期使用的 OSCE方法,联合 150 多位一线医生,构建了动态问诊评测体系SCAN-bench。它不考查静态记忆,而是以真实临床经验为评分标准,通过多轮、动态的方式完整模拟医生从接诊到确诊的全过程。
此外,Baichuan-M4 推出,打通历史病历、多轮问诊、化验趋势与用药反馈,让模型在多次对话中始终掌握患者是谁、既往有过哪些疾病、各项指标如何变化,而不必每次从零开始。
在长上下文临床记忆评测中,M4 取得 86.9 分,为同类最高,较上一代 M3 提升 21.1 分。
百川还首创“证据锚定”,要求模型生成的每一句医学结论,都精确对应到原始论文或指南中的具体段落,而不只是标注引自哪篇文献。依托六源循证范式,模型只在权威医学
M4 在此之上,把权威指南、专家共识与真实诊疗流程,进一步拆解为标准化、可复用的临床路径单元,目前已超过 1000 个、覆盖 200 余种疾病,每一条都由资深临床专家定义和校验。










