打开AI的“黑匣子”!谷歌DeepMind 眼病诊断AI大突破,给出 “思考”过程

在眼部医疗护理方面,人工智能已经证明了它们可以与医生诊断特定疾病的准确性相媲美,但是,由谷歌DeepMind和英国医生设计的新系统则使眼部医疗AI向前迈进了更为关键的一步:它还可以向用户展示它是如何得出结论的。日前发表于《Nature Medicine》杂志上的一项研究报告称,DeepMind系统可以识别数十种疾病,并指出其用于诊断的光学相干断层扫描部分,这是验证AI技术安全性和有效性的一个关键因素。

 

 

报告指出,根据对伦敦Moorfields眼科医院以往患者扫描结果的回顾,该AI系统对超过94%的病例提出了正确的转诊建议,并且其表现与检查相同扫描结果的顶级眼科专家一样好,甚至更好。专家表示,在这样一个开放式的查询中,其准确度水平令人印象深刻,但更大的突破是该系统对所谓的人工智能“黑匣子”问题的解决,它让AI如何“思考”这一过程得到展示。

 

长期以来,AI系统的不透明性阻碍了卫生保健部门对这类产品的采用,人们希望能够理解其理论基础并进行训练,确保AI给出的建议是基于科学而非假设。“医生和病人想要的不仅仅是一个机器给出的答案,他们想知道的为什么会给出这样的答案。” 麻省理工学院研究计算成像的副教授拉Ramesh Raskar说道:“护理有一定的标准,如果AI无法遵循这种标准,人们的舒适感就会降低,即便它非常聪明。”

 

这项由DeepMind研究人员和眼科医生共同进行的新研究,是AI在医学应用上的最新研究之一,苹果、亚马逊、IBM和微软等科技巨头都在开发用于医疗保健的AI产品,制药商正在寻求使用AI来加速新疗法的开发,而医院也在使用AI来提高医疗护理水平和协作的效率,以及帮助医生诊断疾病,更快更准确地推荐治疗方法。

 

许多创业公司和医生个人也在开发基于AI的系统,13日刊登在《Nature Medicine》上的另一篇论文介绍了纽约西奈山伊坎医学院的研究人员测试的一项新技术,该技术使用深度神经网络来识别急性神经事件,比如在CT扫描中识别出中风,从而加快诊断和治疗。

 

目前人工智能的大部分研究和开发都集中在眼部护理领域,这一领域扫描非常频繁且专科医生较为缺乏,因而AI技术的发展较为成熟。今年4月,FDA批准了第一款可以诊断糖尿病视网膜病变的软件--IDx-DR,它可以在没有临床医生参与的情况下诊断疾病。

 

除了它的原理可视性,DeepMind研发的该AI系统脱颖而出的另一原因在于,它不仅专注于单一的疾病,而是能够根据其对成像数据的学习来识别50种不同的眼疾,并且还可以分析三维扫描成像,对比之前依赖二维图像的AI系统可以处理更多的数据。研究作者还表示,通过一定的额外训练,该系统可以在多种类型的扫描仪上达到高水平的精确度。

 

该系统采用了一种新颖的架构--使用了两种神经网络,第一种将原始的眼部CT扫描转化为组织图,第二种则分析组织图以识别眼部疾病症状,用户可以通过视频观看AI如何基于扫描成像得出结论,并对每个可能的诊断给出的相应置信度。

 

虽然该系统展示出了强大的应用前景,但目前还不会很快在医院使用,也不会脱离人类专家的扫描检查。研究作者表示,该系统还需要在进行数年的改进和测试,包括随机对照试验等之后才能用于临床护理,并且即便如此,也仍需要一定程度的人为监督。“在将该系统用于患者治疗之前,我们必须要在多个不同的地方进行前瞻性研究。” Moorfields 眼科医院医生、研究合着者Pearse Keane博士说道,“我们都认为这项技术可能会带来变革,但也承认这不是魔法,我们必须对它采取非常严格的测试。”

 

基于AI的诊断或治疗所需的证据仍然是一个存在争议的问题,并且根据产品类型和销售公司的不同存在很大差异。DeepMind和Moorfields的做法与IBM及其临床合作伙伴纪念斯隆凯特琳癌症中心的做法不大相同。IBM一直在积极推广,并将其Watson系统出售给亚洲各地的医院,但并未公布关于Watson对医生决策或患者预后影响的前瞻性研究。尽管此前其内部的肿瘤学家曾批评Watson系统缺乏更多的证据,并且也有客户反馈过该系统给出的建议有失偏颇。

 

虽然人工智能在医学上很大程度上仍处于实验阶段,但它为改变医疗服务提供了巨大的潜力。光学CT是美国最常见的成像方法之一,2014年医疗保险受益人共接受了535万次扫描。在某些地区,专家的短缺使得视力下降的患者接受准确的诊断和及时的护理变得较为困难。在英国,专家的短缺比美国更严重,根据该研究,英国有超过200万人在视力丧失的情况下生活,预计这一数字到2050年将增加一倍,这意味着一些病情严重的病人最终要等待数周甚至数月才能得到治疗。

 

Keane提到了一名患者的经历,她因为黄斑变性而面临完全丧失视力的风险,当她剩下的好眼睛开始出现问题时,她寻求了紧急的医疗预约,但仍需等待六周才能看到专科医生。Keane说道:“显然,全世界都面临着这样的问题,如果是我母亲或者我的家人,我希望他们能在6天而不是6周之内得到诊治。”

 

研究中使用的AI系统证明了通过自动化减少积压的潜力,在该研究中,AI的任务是用Moorfields转诊系统诊断50种不同的疾病并对患者进行分类。在对997例患者的历史性光学CT扫描中测试了它的准确性,这些扫描和文件也由8名人类专家检查。在最紧急的转诊中,AI与两位顶级视网膜专家的准确率相当,并且表现优于另外两位专家和四位验光师。在所有的病例中,当人类专家仅限于审查扫描结果时,AI的错误率(5.5%)略低于前两位人类专家(6.7%和6.8%),而当一些专家在能够审查患者的病历和其他补充材料时,他们的表现与AI相当。

 

马萨诸塞州眼耳医院的眼科医生John Miller博士没有参与这项研究,他表示,研究中该系统面临的最大问题是谁能够使用它,初级保健医生、药剂师还是专科医生。

 

Miller表示,通过简化转诊系统帮助患者及时得到护理,AI可能在以上所有情况下都有用,但它在初级护理级别时可能更有用。他说:“如果这一能够在早期识别视网膜特异性疾病的系统能得到有效可行的应用,那么就可以促使患者得到提前预约,并有可能挽救视力。”Miller补充道,AI的使用还可能节省时间、金钱以及对可能的错误诊断的担心。“我认为这将帮助我们更好地识别患者的疾病类型,而不用去进行逐一筛查。”