据央视新闻报道,中国中医科学院携手中国信息通信研究院、中国科学院自动化研究所等多家权威研究机构,共同公布了国内首部AI中医药大模型评测团体标准。
在中医药行业与人工智能技术的深度融合、蓬勃发展的过程中,如何科学、准确地评估这些模型的性能与价值,成为了亟待解决的关键问题。此次发布的评测团体标准,正是为破解这一难题而精心打造的 “金钥匙”。
该标准覆盖了场景丰富度、能力支持度、应用成熟度三大能力域。在场景丰富度方面,全面考量中医药大模型在各类实际场景中的应用广度,从日常的中医门诊诊疗,到复杂的中医住院治疗流程,再到中医药科研实验场景等,确保模型能够适应多样化的现实需求。能力支持度则聚焦于模型本身所具备的技术能力,例如其对海量中医药数据的处理与分析能力,能否精准识别和理解中医经典文献中的晦涩术语,以及在模拟中医辨证论治过程中的逻辑推理能力等。应用成熟度维度主要评估模型在实际推广应用过程中的稳定性、可靠性以及用户体验等方面。
为了更细致、精准地进行评价,标准进一步设置了中医临床诊疗、中医教育、中药研究等13个能力子域。通过对这些能力项的逐一评测,能够全方位、深层次地剖析中医药大模型的优势与不足,为其持续优化提供科学依据。