《Nature Medicine》再迎重磅医学NLP科研成果!广州市妇儿医疗中心与依图医疗强强联手


北京时间12日零时14分,国际知名医学科研期刊《自然医学》(Nature Medicine)在线刊登于文章题为《使用人工智能评估和准确诊断儿科疾病》(Evaluation and accurate diagnoses of pediatric diseases using artificial intelligence),此文是由广州市妇女儿童医疗中心夏慧敏教授、张康教授(加州大学圣地亚哥分校)、数据中心梁会营博士、医务部孙新主任以及儿内科门诊何丽雅主任团队与依图医疗、康睿智能科技等业内顶级研究团队及广东省再生医学重点实验室,利用人工智能技术诊断儿科疾病的重磅科研成果。这是全球首次在顶级医学杂志发表有关自然语言处理(NLP)技术基于中文文本型电子病历(EMR)做临床智能诊断的研究成果。

《Nature Medicine》再迎重磅医学NLP科研成果!广州市妇儿医疗中心与依图医疗强强联手399

这是该团队在《细胞》杂志封面发表有关AI图像诊断的论文后,不到一年时间里,在AI技术实施应用于医疗方面取得的另一个重要里程碑。它标志AI模拟人类医生进行疾病诊断时代的到来。

不仅能够“看图”识别影像,还能“识字”读懂病历

近年来,AI在基于医学图像的诊断工具表现抢眼,但一般还局限于相对标准化的静态图像数据。在这项最新科研成果中,人工智能在识别影像的基础上,通过自动学习病历文本数据(医生的知识和语言)中的诊断逻辑,逐步具备了一定的病情分析推理能力,能更进一步读懂、分析复杂的病例,意味着人工智能或将能像医生一样“思考”。

研究人员们训练AI理解海量电子病历中的临床特征数据,包括患者主诉、症状、个人史、体格检查、实验室检验结果、影像学检查结果、用药信息等多方面的数据。研究团队利用依图医疗的NLP技术建立一套病历智能分析系统,深度挖掘和分析医疗文本的信息,将非结构化文本形式的病历数据变成规范话、标准化和结构化的数据,以便AI可以准确完整地“读懂”病历。为此,医生、科学家和技术人员通力合作,由30余位高级儿科医师和10余位信息学研究人员组成的专家团队手动给电子病历上的6000多张图表进行注释,并持续对模型进行检验和迭代。

研究团队还开发了一套诊断结果智能推荐系统,模拟人类医生的诊疗路径,把目标患儿进行逐级判定。广州市妇儿中心医务部主任孙新认为,“专业儿科医生高质量的先验医学知识输入成为这套系统的关键优势”。具体来看,这套系统首先会按呼吸系统疾病、胃肠道疾病、全身性疾病等几大系统分,然后在每一类下面做细分。举例来说,在最常见的呼吸系统疾病中,这个系统会先按上呼吸道和下呼吸道进行区分,再按喉炎、气管炎、支气管炎、肺炎进行细分。经过检验,在每一层级,由AI做出的初级诊断在精确度上都接近检查医师做出的初级诊断。例如在患儿群体中最常见的急性上呼吸道感染,模型对病例的诊断达到95%的准确率。

《Nature Medicine》再迎重磅医学NLP科研成果!广州市妇儿医疗中心与依图医疗强强联手1201

对于一些凶险的、有可能威胁生命的疾病(例如急性哮喘发作、细菌性脑膜炎等),算法也同样表现出了强大的诊断性能。广州市妇儿中心儿内科门诊主任何丽雅认为:“这在临床应用中有非常重要的意义,因为有了AI快速分诊的辅助,就可以让医疗服务的有限资源用于最需要帮助的患者。”

依图医疗提出并测试了一个专门对电子医学病例进行数据挖掘的系统框架,将医学知识和数据驱动模型结合在一起。该模型先通过NLP对电子病例进行标注,利用逻辑回归来建立层次诊断,在诊断常见儿童疾病方面可与经验丰富的儿科医生相媲美。

依图医疗CEO倪浩(论文共同第一作者)表示:“此次成果的核心技术部分,实际上是通过深度学习技术与医学知识图谱,对EMR数据进行解构,从而构建了高质量的智能病种库。使得后续可以较容易地利用智能病种库建立各种诊断模型。而诊断模型证明了基于AI的系统可以帮助医生处理大型数据和辅助诊断,同时在诊断的不确定性和复杂性上给予临床支持。儿科疾病症状多种多样,临床医生同样难以区分,诊断流程费时费力,但明确诊断非常重要。拥有可与经验丰富的儿科医生相媲美的助手进行辅助诊断,能够让医生有效地降低诊断时间,显著优化诊断流程。”

可应用于诊断多种儿科常见疾病,准确度与经验丰富的儿科医师相当

通过自动学习来自56.7万名儿童患者的136万份高质量电子文本病历中的诊断逻辑,该AI应用于诊断多种儿科常见疾病,准确度与经验丰富的儿科医师相当。研究人员随机抽出12000份患儿病历,并把20位“参赛”儿科医生按年资和临床经验高低分成5组,看看AI的成绩和哪一组医生接近。结果显示,AI模型的平均得分高于两组低年资医生,接近三组高年资医生。

研究人员介绍,该AI系统可以通过人机交互获取患者或家长口述文本,包括主诉、症状、疾病史、用药史等信息,做出粗略诊断,给出可能的疾病范围;通过医生当面问诊或互联网远程问诊,获取详细病情及鉴别诊断特征,模型据此重新运算,给出具体的精确诊断;如果有实验室检验或影像检查数据,AI模型还可以进一步确认其诊断结果。更重要的是,它具备增量学习的功能,在实践中对于被采纳的结果会增强记忆,对于未被采纳的结果在核实之后会通过继续学习实现能力的提升。” 广州市妇女儿童医疗中心数据中心主任梁会营博士(本文第一作者)透露,通过上线后三个月的完善迭代,该系统在2019年的第一季度调用量已经超过了3万次,他强调这些调用的数据是对辅诊熊实用性能评估、针对性能力提升的指南针。

仍有很多基础性工作要做,未来或有更加广阔的前景

广州市妇女儿童医疗中心主任夏慧敏表示:“国家大力推进的人工智能规划,让我们看到了契机,基于信息化产生的优质医疗大数据落地AI技术和平台,既能在一定程度上解决医疗服务能力不足的问题,又能提高健康服务的公平性和可及性。我们希望在不久的将来,这项技术将能形成大范围的示范推广,为为基层儿科医生和年轻儿科医生提供辅助诊疗服务,为患儿家长提供智能自诊服务和权威的第二诊疗意见,避免误诊、漏诊造成的医疗风险。

据研究团队介绍,这个人工智能辅助诊断系统将可以通过多种方式应用到临床中。首先,它可以用作分诊程序。例如,当患者来到急诊科,可由护士获取其生命体征、基本病史和体格检查数据输入到模型中,允许算法生成预测诊断,帮助医师筛选优先诊治哪些患者;另一个潜在应用是帮助医师诊断复杂或罕见疾病。通过这种方式,医师可以使用AI生成的诊断来帮助拓宽鉴别诊断并思考可能不会立即显现的诊断可能性。

对于个人工智能辅助诊断系统的未来,夏慧敏教授表示:“这项研究,将会成为AI技术在医疗中实施应用的重要里程碑。其最大的贡献在于,AI不仅仅能够“看图”,而且能够“识字”,能像人类一样读懂文本中蕴藏的疾病信息。

通过系统学习文本病历,人工智能或将可以诊断更多疾病。但须要清醒认识到,我们仍有很多基础性工作要做扎实,比如高质量数据的集成便是一个长期的过程,因为大数据的收集和分析需要算法工程师、临床医生、流行病学专家等在内的多专家通力合作。此外,人工智能学习了海量数据后,其诊断结果的准确性仍然需要更大范围的数据对其进行验证和比对。”

广州市妇女儿童医疗中心简介

广州市妇女儿童医疗中心是华南地区规模最大的三级甲等妇女儿童医院,开放床位数1700张,2018年全年门急诊量约463万人次,住院病人近14万人次,分娩量3.2万人,手术量8.7万台次,在复旦最佳医院综合排名中连续7年进入百强。拥有国家卫生部临床重点专科3个,广东省临床重点专科(学科)6个,广东省“十二五”医学重点实验室2个;拥有国际标准的百万级生物样本库,建立了全世界规模最大之一的妇幼队列研究平台;设立了博士后科研工作站,建立了11个独立实验室,从全球引进PI13名,在站博士后70余名;2018年获得国家自然基金项目30项;SCI文章195篇,影响因子总分665.891分。2019年1月,成功入选广东省高水平医院第二批重点建设医院;通过了国家电子病历评级6级和国家医疗健康信息互联互通标准化成熟度测评五级乙等评审,通过国际HIMSS EMRAM住院及门诊双7级评审,是国内首家推行移动挂号、非急诊挂号全面预约和“先诊疗后付费”的智慧型医院,获中央电视台《新闻联播》和《人民日报》报道,被评为2015-2017年全国优质服务发挥信息优势示范医院。

依图医疗简介

作为医疗人工智能的领军企业,依图医疗在国内率先广泛开展医疗人工智能的落地实践,是目前国内唯一覆盖全链路医学智能的医疗人工智能公司,产品涵盖智能医学影像、智能临床大数据、智能门诊优化、智能质量控制等多个领域,旗下care.ai系列AI应用已落地全国100余家三甲医院,并向县市级医院延伸,切实提升医疗效率,赋能基层医疗,为推进智能医院建设及国民健康水平提升而积极探索。

康睿智能简介

广州康睿智能科技有限公司是一家从事医疗人工智能技术研发与商业化的高科技公司,成功入选了第一批广州再生医学和健康广东省实验室的创新创业团队。公司以强大的专业医生阵容和顶级AI专家加盟,解决了机器学习环节中大数据运算的核心问题,发掘了基于医学影像学和病人综合电子病历系统的超算方式。公司拥有多个国际专利。多项研究成果在国际顶级期刊《Cell》、《Nature medicine》上发表,获得国际同行专家认可。