医学影像信息系统

核心提示尽管临床科研与应用开发已经进入智慧化时代,但国内海量的医学影像数据并未形成可归纳、可应用的大数据。标准化的医学影像数据集仍是一种稀缺资源,影响着相关科研与产业的快速发展。而今,这一局面即将迎来改变。2022年7月5日,国家卫生健康委能力建设

虽然临床研究和应用开发已经进入智能时代,但是国内海量的医学影像数据并没有形成可以总结应用的大数据。标准化的医学影像数据集仍然是一种稀缺资源,影响了相关科研和产业的快速发展。

现在,这种情况即将改变。

2022年7月5日,国家卫健委能力建设与继续教育中心发布《关于影像数据库建设项目评估结果公示的通知》,正式拉开影像数据库系统化建设的序幕。

放射影像数据库建设项目由国家卫生健康委能力建设与继续教育中心主办,全面领导和协调数据库的系统化建设,计划开展数据采集、数据处理、质量控制、科学研究、产品研发、技术改造、医学数据标准培训等重点数据库建设工作。

根据文件,第一批放射影像数据库建设项目共13项,包括心脑血管影像数据库、慢性肝病和原发性肝癌影像数据库、缺血性心脏病核医学多模态影像数据库、胃肠道疾病影像数据库、急诊影像数据库、慢性阻塞性肺疾病数据库等严重影响我国居民生命健康的重大疾病数据库。储备中还列有8个建设意向,有望在后续批次中纳入建设。

2022年射线数据库项目清单

放射学数据库储备的主题列表

此次影像数据库的系统化建设,在疾病分类的粒度上更加精细,对从数据库建设到后续影像资料采集、标准、质量控制等环节所涉及的各类标准都做了明确的规划和要求。

同时,在本次数据库建设中,项目组非常注重工程团队的整合。国家卫健委能力建设与继续教育中心委托上海九州智能医学影像研究所帮助组建了一个医生和工人的跨团队,并做了从基础到全路径的准备,包括多源异构数据的纳入、多中心安全采集的技术支持、分布式数据采集系统的开发、通用和定制的标注平台、特殊疾病数据库的技术路线,以及相关的安全和其他保险、电子病历数据标准、openEHR标准体系等。,这样技术就可以为数据库铺平道路。此外,国内原创的AI算法也将适时融入到构建过程中,服务于数据整理、图像提取、病灶重建、科研方向快速验证等场景。因此,整个过程将加速数据库技术和AI技术在放射影像领域的应用和突破。

为了了解数据库建设的背景、难点和未来价值,动脉网对相关文献进行了详细的研究,并采访了放射影像数据库专家委员会主席柳时元教授,试图回答以上三个问题。

柳时元,主任医师,教授,博士生导师。

上海常征医院放射科主任

中华医学会放射学分会主任委员

中国医学影像人工智能产学研创新合作平台主席

放射影像数据库专家委员会主席

放射影像数据库建设的背景与规划

时间追溯到两年前。人工智能产品在医学影像领域的应用开始突破,个别产品获得了国家美国食品药品监督管理局颁发的三类医疗器械注册证书。但总体来看,数字化、结构化的医学影像大数据未能形成体系;医学影像数据库仍然是制约AI发展的重要因素之一;面对广泛的临床需求,单任务AI产品的审批也存在不足。

为打破医学影像数据集缺乏的僵局,国家卫健委能力建设与继续教育中心于2020年启动了放射影像数据库建设,聘请柳时元教授担任项目专家委员会主席,牵头建设国家高标准医学影像数据库。

“无论从科学研究、临床教育还是人工智能的发展,我们都需要一个大样本多样性、标准化、高标注的数据库,但我们现在非常缺乏这样的数据库。制定和完善数据所有权、安全、伦理等方面的配套法律法规。也相对落后。”柳时元教授说。

在此背景下,柳时元团队将第一个项目聚焦于相对成熟的肺结节,旨在通过构建肺结节的标准化医学影像数据库,促进肺结节的筛查和良恶性的准确鉴别诊断。同时,希望通过肺结节数据库的建设,探索专家对数据集的基本要素、建设流程、建设标准、标注和质量控制的共识,为后续其他数据库的建设提供参考。

到2021年10月,团队利用基于医学大数据和AI技术开发的数据平台,完成了数据提取、处理和转化,最终形成了高质量的肺结节图像数据库。目前,该数据的价值及其构建过程已经得到医学界的认可。

在最初的“打样”取得良好效果后,开始了图像数据库的系统化建设。

医学影像数据库建设的三个步骤

根据重大疾病医学影像数据库建设项目实施计划,项目建设周期为5年,分三个阶段进行。第一阶段为签约日至2022年12月底,为标准成立期;第二阶段为2023-2025年,为数据平台建设期;第三阶段是2025年至2027年,为开发应用期。

具体来说,第一阶段,建立基于部位或器官疾病的单病种或多病种医学图像的图像采集与识别标准、图像分割与标注标准以及相关数据库建设标准的共识;建立数据建设技术团队,搭建数据库技术和管理平台。

标准制定后,更重要的是搭建第二阶段。这一阶段的任务可分为建立符合中国人群特点和临床诊疗规范的多模态、大容量、高质量、丰富的医学影像数据库;建立多疾病人工智能医学影像数据安全研究服务平台;培训体系建设;技术研究、开发、推广和应用。

重大疾病医学影像数据库二期建设的任务和内容

实施方案没有给出第三阶段的详细建设任务和内容,但如果能在给定的时间内完成第一、二阶段的任务,医学影像研究及其衍生应用也将得到足够有力的支持,能够步入下一个发展阶段。

总的来说,项目计划在未来三年内建立基于部位或器官疾病的单病种或多病种医学图像的图像采集与识别标准、图像分割与标注标准、相关数据库建设标准的共识;建立多模态、大容量、高质量、丰富的符合国人特点和临床诊疗规范的医学影像数据库,利用优质的国家医学影像数据资源,助力健康中国建设。

射线数据库建设面临的挑战

放射学数据库的价值恰恰在于它可以解决现阶段我国影像资料面临的困难。

“中国是医学数据大国,医学影像占医学数据的80% ~ 90%,并以30%的增速持续增长。”柳时元教授告诉动脉网,“然而,大量的医疗数据并不意味着中国已经拥有系统的医疗大数据。其中80%以上的数据是非结构化的,没有办法挖掘价值。”

射线数据库的建设是一个重要的解决方案。通过建立一个大规模的、标准化的、结构化的影像数据库,不仅可以建立标准,打破医院之间的壁垒,还可以将成熟的数据库应用于医学教育和科学研究。推动相关人才培养和精准诊疗创新。

然而,明确放射影像数据库的价值很简单,但在实践中建立起来却非常困难。

“建立标准化数据库的呼声很多,成果有限,可见这是一件非常复杂和困难的事情。”

数据多样化是第一个难点。柳时元教授认为,要建立一个标准化的图像数据库,我们会遇到数据来源的多样性和非同质性问题。如何将这些“差异”纳入统一的规范或标准,是难题之一。此外,如何将多模态数据,如CT、钼靶、核磁共振图像、临床病史、实验室检查等重要文件整合到一个便于分类、提取和协同使用的数据系统中,也是数据采集中需要考虑的重要问题。

其次,标准化的数据标注。“对于图像中不同的标志,我们必须在量化识别方法、分割方法、分类方法上形成共识,在共识的基础上进行训练,然后进行标记。贴标环节需要满足数据可追溯的条件,必须通过三级质量控制,通过仲裁和审核才能入库。确保标准流程的准确性。”

最后是数据库的管理和更新。“数据库必须保持动态,不断增加数据量,不断更新其数据构成,保证数据在整个过程中的安全性,这也需要我们的持续投入。”集权与分权的设计和相关伦理的推进也是数据库建设的重要探索方向。

由于建设过程的复杂性,进行有效的顶层设计尤为重要。在数据库建立之初,相关负责人必须明确数据库建立的目的、用途和质量控制,确定数据标准和标注方法,逐步规划整个团队的分工和协作。这些都做好之后,相关负责人就可以开始实施了。

除了数据库建设本身的高技术门槛外,整个过程需要相关人员在很长一段时期内投入大量的人力、财力和精力支持,大部分项目都无法以小而慢的回报熬过数据库建设的初级阶段。因此,国家对放射影像数据库建设的支持和引导是必要的,企业、医生、学者也需要共同努力参与。

柳时元教授认为:“只有通过政府、企业和研究机构的充分合作,避免散、乱、差和重复建设,才能尽快有效地建立放射影像数据库。”

谁是放射影像数据库的用户?

有大量的医学从业者参与成像。要回答数据库的建立谁会受益,需要从教育、科研、研发等角度进行独立分析。

首先是教育。随着医学人工智能在影像科的普及,新型放射科医生的培养方式也需要根据科技的发展进行调整。此外,由于新技术带来的工作流程等因素的变化,现有放射科医生的继续教育也需要跟上。但到目前为止,由于没有标准的数据库支持,放射科医生很难基于标准化的数据和人工智能开展培训,医生也很难独立执业。

在这种情况下,标准化影像数据库的建设是对现有影像教学体系的重要补充。数据库建好之后,中青年放射科医生就可以利用数据库建立模型并进行验证。还可以根据病例资料学习临床诊疗经验。此外,以临床需求驱动应用为研究突破点,探索以患者为中心,以疾病为导向,结合影像、病理、生化甚至基因的多中心大数据精准医疗研究。

其次是科研和AI研发。它是数据AI的基础。目前,人工智能辅助诊断和检测大多采用监督学习。产品的研发、测试和质量控制都需要依靠大量的标准审查案例。监管机构、医院、企业、教育科研机构等认可的图像数据集。可以支撑人工智能产品研发的上下游需求,从而推动更多新研发的AI产品的临床落地和使用。

因此,由卫健委牵头,多家医院开发的放射影像数据库就显得尤为重要。在与现实世界实际情况高度一致的数据库支持下,无论是企业对AI的研发审批,还是医生开展的影像相关课题,都可以更频繁地开展多中心研究,或者加快医学影像的科研水平,有效拓展医学AI的开发应用范围,推动医学影像研究进入快速发展期。

虽然建立一个医学影像数据库很重要,但我们仍然需要思考如何让数据库真正运行起来。

柳时元教授认为:“要让大家使用数据库而不是把它放在那里,应该有一个第三方的公共平台,充分考虑合规性、安全性和伦理性,在国家法律法规的要求下进行权威、公正、中立、规范的操作。同时也要继续思考监管机构认证下合规安全的运营模式,让数据库真正产生学术价值、科研价值和社会价值,让人的数据服务于人的健康。”

图像数据库的未来价值值得期待。当国内放射影像数据库进入专病时代,意味着医学影像人工智能等数字技术将跃入更深层次的探索。或者我们可以通过数据发现更多疾病的体征和逻辑,真正释放放射科的智能、精准、临床、院前、联网等诸多价值。

 
友情链接
鄂ICP备19019357号-22