科研资讯

上海人工智能实验室发布 新版中文医疗大模型权威评测平台

研发家 | 2025-12-03
0

近日,上海市人工智能实验室发布中文医疗大模型权威评测平台MedBench 4.0,这是国内首个面向垂直大模型、专用大模型、应用场景的医疗大模型评测与验证体系。业内人士介绍,MedBench 4.0为衡量医学AI产品性能与可靠性提供了科学标尺,保障了医疗人工智能产品质量的提升与行业良性竞争。

  据悉,中文医疗大模型权威评测平台MedBench首发于2023年年中,目前更新至第四版。上海人工智能实验室医疗和评测中心负责人徐捷介绍,本次升级包含大语言模型、多模态大模型及智能体三大技术范式,深度对齐国家《卫生健康行业人工智能应用场景参考指引》,覆盖60个全自主构建评测集,共70万余专业评测题。

  记者从上海市人工智能实验室了解到,针对大语言模型评测,平台围绕医学知识问答、语言理解、生成、复杂推理及安全伦理等维度构建了评测集,并创新引入科学指标体系,以缓解模型信息遗漏或幻觉生成等问题对评测结果的影响;针对多模态大模型评测,瞄准医疗影像、检测报告等临床核心场景,平台可覆盖目标检测、图像分类、多模态报告质控、序列影像理解、病程动态追踪等10项细分任务,填补了中文医疗多模态评测领域的技术缺口;针对智能体评测,平台则重点解决智能体执行断层的问题,推动医疗智能体从“能对话”向“能执行、能协作”演进。

  对于医疗大模型评测的意义,徐捷告诉记者,评测首先可以验证医疗大模型的合规性,其次是验证其专业性,比如会不会误诊、漏诊或者开错药,最终帮助市场更好地训练出优质的医疗大模型。

  记者注意到,目前,不少通用大模型如深度求索、千问等都可以分析体检报告和检查报告。那么,医疗大模型的价值何在呢?

  对此,徐捷介绍称,主流通用大模型可以满足日常健康咨询。评测显示,国内头部通用大模型的医学能力已经超过国外同类产品。但对于需要给出专业判断的医疗场景,例如要做哪些检查、如何解读报告、应开什么药或者中医方剂等,大模型还需整合大量医学数据、专家医案和临床经验等语料。医疗大模型能高效处理海量信息,提供循证参考,有助于提升医生诊疗水平、补足基层医疗短板,进而实现医学普惠。

  除推出权威评测平台,上海人工智能实验室还联合专业医疗机构和相关企业,推出了儿童眼病智能筛查与精准干预系统、胃肠多模态辅助诊疗大模型等医疗人工智能应用。(记者 叶健 )

版权及免责声明:本网站所有文章除标明原创外,均来自网络。登载本文的目的为传播行业信息,内容仅供参考,如有侵权请联系删除。文章版权归原作者及原出处所有。本网拥有对此声明的最终解释权
分享

赞一个

0
推荐会议 更多>>
往届已检索 | 2025年第四届新能源与材料国际学术研讨会(IYSF-NENM2025)

EI Compendex,Scopus

往届已检索 | 2025年第四届新能源与材料国际学术研讨会(IYSF-NENM2025)

即将截稿

多届检索

2025-12-12 - 2025-12-14
IEEE出版|2025年人工智能驱动图像处理与计算机视觉技术国际学术研讨会  (AIPCVT 2025)

EI Compendex,Scopus,IEEE Xplore

IEEE出版|2025年人工智能驱动图像处理与计算机视觉技术国际学术研讨会 (AIPCVT 2025)

热门会议

快速见刊

2025-12-12 - 2025-12-14
IEEE出版|2025年电力系统、智能电网和人工智能国际会议(PSGAI 2025)

IEEE Xplore,EI Compendex,Scopus

IEEE出版|2025年电力系统、智能电网和人工智能国际会议(PSGAI 2025)

官方推荐

IEEE出版

2025-12-26 - 2025-12-28
IEEE出版|2025年人工智能、商务智能和电子商务国际学术会议(AIBIEC 2025)

EI Compendex,Scopus,IEEE Xplore

IEEE出版|2025年人工智能、商务智能和电子商务国际学术会议(AIBIEC 2025)

热门会议

交叉学科

2025-12-26 - 2025-12-28
IOP出版|第二届人工智能、光电子学与光学技术国际研讨会(AIOT 2025)

EI Compendex,Scopus

IOP出版|第二届人工智能、光电子学与光学技术国际研讨会(AIOT 2025)

交叉学科

检索稳定

2025-12-12 - 2025-12-14
IEEE出版|2026年人工智能与社交网络系统国际学术会议(AISNS 2026)

IEEE Xplore,EI Compendex,Scopus

IEEE出版|2026年人工智能与社交网络系统国际学术会议(AISNS 2026)

交叉学科

官方推荐

2026-01-09 - 2026-01-11
2026年人工智能与社交网络系统国际学术会议暨智能计算与网络安全研讨会

EI Compendex,IEEE Xplore,Scopus

2026年人工智能与社交网络系统国际学术会议暨智能计算与网络安全研讨会

新会上线

官方推荐

2026-01-10 - 2026-01-11
2026年大湾区具身智能论坛(EI-OAHV 2026)

EI Compendex,Scopus

2026年大湾区具身智能论坛(EI-OAHV 2026)

前沿会议

官方推荐

2026-01-16 - 2026-01-18