产品与生态圈共建是医学人工智能新出路?翼展科技重新定义医学影像AI
“人与动物最本质的区别在于人能制造和使用工具。”从原始时代至今,我们一直通过实践带来的经验积累不断改善我们的生产工具。
如今,人工智能时代的到来加速了生产工具的升级。我们可以通过极快的速度汇集名医的工作成果,再造一个“名医”,并以此辅助年轻医生的工作。未来,低年资的医生可获得高年资医生的工作能力,而高年资的医生将解放自我,去寻求更深远的医学突破。
然而,这个过程中任重道远,要想实现这一图景,并非仅仅依靠人工智能技术的发展就能达成。一方面,我们需继续有效地收集、利用大量医疗数据;另一方面,只有对医疗领域进行结构性的升级,才能将这些技术下放基层,实现基层生产力的升级。
现状:过多的医疗需求和有限的医疗服务
据数据显示,中国放射检查每年约20亿人次,而50%的放射检查中为DR检查。医生每天需要耗费大量时间来撰写文字报告,描述检查中患者的临床表现,并给出诊断意见。
医疗图像的阅读与理解通常是由专业的医疗从业者完成,而在中国这样人口众多的国家,医生每天需要阅读数百张图像。这些工作不仅占用了他们大量的时间,编写医疗图像报告的过程也过于重复乏味。
更严重的问题在于,大部分患者身处基层,而优秀的医疗资源却聚集于一二线城市,这导致过低的医疗服务能力承担了过高的工作量。留在基层的医生要么是刚进入行业的新人,要么是退休后回聘的老人;年轻医师受限于专业知识,难以高效准确地编写医疗图像报告,而老医生则疲于应对数百计的体检报告,易于忽略报告之中的问题。有数据统计,基层医疗的综合误诊率高达60%。如此高的误诊率下,医疗机构的声誉深受影响,患者前往北上广就医的意愿愈发强烈。
那么,人工智能能改变这一现状吗?
第一步:以AI技术赋能基层医疗
在CCR大会上,西安翼展电子科技有限公司发布了人工智能产品W-insight,这款产品可基于DR的胸部图像自动生成对应胸肺17种病种的分类与影像学表现报告,实现了阅片、诊断、出具报告的全流程诊断,可广泛的运用于患者体检相关项目,大幅降低体检机构的运营成本,有效提高基层医疗服务水平。
刘士远主任参与翼展科技产品发布会
翼展科技CTO边海峰在发布会上谈到:“相对于现有的DR产品,市场上大多数医学影像AI聚焦于计算机视觉领域的突破,而如今的产品场景需要计算机视觉和自然语言分析两个领域共同突破。这两个领域各自拥有极高的技术壁垒,更何况将两个领域进行协同?”对于产品在研发过程中遇到的挑战,他认为主要来自于三个方面。
第一,市场上大多数医学影像AI产品都采用单一任务的学习框架。以胸部CT图像的肺结节为例,常规做法是以相关领域已经验证的、效果良好的学习框架做迁移学习,直接嫁接至医学领域。
而在DR这一产品场景中,AI需要根据图像对17种胸部疾病进行多标签分类任务,并完成一个长段落描述的文本生成任务。完成这一任务并无现成的算法可遵循,研发人员需重新开发一个满足多任务融合的深度学习框架。
其次,如何定位非正常图像区域并对其进行正确的描述非常有挑战性。为此,翼展科技引入共同关注(co-attention)机制,同时关注图像和预测疾病标签,建立视觉和语义信息的协同关系。
最后,影像报告中的描述通常很长,而且包含多个句子,现有的单层LSTM模型生成这些长句子非常困难。对于这一问题,翼展科技结合共同关注机制,采用分层LSTM模型,将整个过程分为两步:先生成高级主题,再根据主题生成细粒度描述。
当然,算法的成长离不开优秀数据的检验。在两年的研发过程中,翼展科技收集了来自于近两百家医院的数据,整理出近十万份高质量的图像和对应的报告内容,逐步攻克了上述难题。
如今,翼展科技已应用超过10万例验证数据对产品进行验证,并将进一步通过实践中的数据不断改良产品,使之趋近于完美。
第二步:创新影像生态带动医疗生产力升级
现实之中,基层医疗的医疗硬件设施并不落后,很多县级医院都采购了多排CT,1.5T核磁共振等优秀产品,但由于医院选址不佳、医生资源缺乏,患者缺乏信任等原因,很多医疗设备处于闲置状态,没能被有效地利用起来。
所以,单单运用人工智能技术很难解决这些问题。在国内医疗机构独立、资源缺乏连通的大环境下,更为重要的是重构生态,将闲置的资源利用起来,最优地匹配医疗资源。
本文地址:http://www.fm120.net/content/201902/022025612019.html