浙江省生物医学工程学会

新闻资讯
新闻资讯
学会理事长李劲松教授团队的医疗电子病历研究成果在NATURE合作顶级期刊发表
2023-06-14    编辑:管理员    浏览:1566

转自浙江大学生仪学院




近日,我学会理事长李劲松教授团队与英国牛津大学Tingting Zhu教授团队合作,在nature合作期刊《npj Digital Medicine》(中科院一区Top期刊)发表研究论文。该论文第一单位是浙江大学生物医学工程与仪器科学学院,第一作者是博士生李瑾,李劲松与Tingting Zhu为共同通讯作者。



研究背景

以电子病历(EHR)为代表的患者健康数据是一种在医疗领域广泛存在的数据类型,其蕴含的巨大价值推动了近年来计算健康信息学研究的突破性进展。然而,对患者数据的隐私保护需求限制了医疗机构的数据共享,导致研究人员难以获取临床数据的访问权限。生成数据(Synthetic data)是一种有效的替代方案,高质量的生成数据能够保留原始数据分布中的特征信息,并可用于下游临床数据挖掘任务。然而,当前面向电子病历的数据生成模型存在局限性,现有方法往往只针对单一数据类型,无法建模高维、复杂临床数据间的相关性。


研究方法

为解决上述问题,该文基于生成对抗网络(GAN)提出了一种能够同时生成连续型和离散型时序电子病历的数据生成模型,该模型在生成具有异质性、高维度患者时序特征的同时,能够捕捉特征间的潜在关联信息。该模型首先基于多重损失约束下(变分下界、对比学习损失等)的对偶变分自编码器,将存在于不同特征类型变量域的数据,映射至具有统一高阶特征表示的潜空间中;进而,通过耦合循环生成器捕获连续型和离散型时序数据之间的动态关联。



1·所提出方法的网络结构示意图


研究结果

文中验证了所提出的数据生成模型在三个重症监护数据库上的效果(MIMIC-IIIeICUHiRID)。研究结果表明,该文所提出的时序电子病历数据生成方法在生成数据的真实性、相关性、可用性及隐私性等方面均取得了良好表现。


2·生成数据的可用性验证流程图


3·生成数据的相关性验证结果


4·生成数据用于在下游任务中实现数据增强


结论与展望

针对临床电子病历数据收集过程中出现的成本高、周期长等困难,该文提出的数据生成模型通过提供具有高质量、多类型的生成时序电子数据,帮助研究人员在满足患者数据隐私保护的前提下,更高效地开发医学人工智能模型。未来的研究可进一步拓展数据生成方法适用范围,以适应临床实践中所出现的多种数据模态的需求,从而提升医学人工智能在临床实践中的应用价值。



论文链接:

https://www.nature.com/articles/s41746-023-00834-7