见微知著——医疗大数据之道
在2017中美智能医疗大数据峰会上,PerkinElmer信息科学事业部中国区负责人陈其平先生在演讲中表示:“目前,很多医院着手建立集成平台建设大数据,而PerkinElmer,则利用数据挖掘分析支撑临床科研、医疗质控等工作。”
医疗大数据来袭,小应用常遇大问题
曾有医院院长表示,尽管医院的数据量大,但在做具体的小应用时却常遇到大问题,比如:目前由于过度治疗导致鼻窦炎手术治疗的情况时有发生,他们希望通过治疗前、后的数据对比作分析发布文章,希望告诉大家用药物治疗一样可以达到手术治疗的效果。然而通过数据分析发现只有治疗前的CT检查,没有愈后检查,从而无法判断没来复查是因为治愈还是改去其他医院进行手术,所以全治疗周期的数据统计就成了难题。
陈其平先生针对这一现象表达了观点:“Forrester通过调研得出大数据的项目要持续以月甚至是以年为单位才能完成数据的归档及识别,这其中,有80%的时间需要做数据的集成整合。医院里大大小小有几十套系统,有的医院多达上百套系统,我们不得不花大量的时间对这些系统进行数据集成,其中再花费80%时间进行数据识别,真正用于数据挖掘分析的时间只占20%或更少,实现敏捷数据探索面临着极大的挑战。”
IT技术革新使医疗大数据应用成为可能
数据融合和数据挖掘的层面都是基于数据的利用,在数据利用之前当务之急是要完成数据的整理和分析工作。当下,机器学习、自然语言处理都广受关注,但是目前疾病的描述和诊断都没有标准化的原数据进行支撑,只有将病历中的文本数据进行提炼和融合后,再将非结构化数据转化为结构化数据,实现检索与分析的融合,并且提升大样本数据的“命中率”,才能解决关键问题。
临床科研获取信息的三个关键
1. 即时发现
即时将医院不同系统中的数据实时抽取,将数据的搜集和整合从以月为单位降低到以天或者分钟为单位,才能真正实时为精准医疗提供帮助,实现敏捷数据探索。
2. 360°浏览
实现对患者360度全生命周期数据的浏览,需要及时发现隐藏的生命健康数据和隐藏在非结构化文本中的信息。使得医生能够查看到更为全量的数据,帮助医生从更多的科研维度分析挖据数据,提供开发数据潜力的有效手段。
3.自服务式探索
为医生提供自助式搜索服务,医生可以通过平台自助筛选和搜索自己所需要且满足于科研要求的数据。信息科为每一位医生提供数据服务是非常困难的,但如果医生具备这样的能力,这就诊真正高效可行的方法。
以某三甲医院医生发表SCI 国际期刊文章为例:
从DRGs单病种分析角度来,需从海量电子病历、检验检查及随访系统中寻找所需病例,再从命中病历非结构化数据中增加新的维度。采取这种传统方式耗时费力,据统计,完成整个过程的时长需达6个月之久。但如果利用智能数据关联、全局数据检索、自服务可视化数据探索的方法,效率就会大大加快,只需要6天就能够完成。
定量病理学推动临床科研发展
众所周知,中国的病理医生非常缺乏,病理样本非常珍贵。找到开发数据潜力的有效手段是实现病理样本高效利用的必经之路。
目前,高质量显微成像技术和智能分析算法推进了定量病理学的发展,定量病理学已有了重大的突破,并正在实现从科研到临床的跨越。定量病理学是利用数据化的图像分析方法,将病理观察结果进行量化,以乳腺癌组织为例,人工智能不仅能够通过“自学习”的方式识别癌症区域、腺体、基质及脂肪,还能实现定量和细胞分型。原本病理科医生需一天才能完成200个病理报告,如果通过机器学习,可以一小时完成200幅图像的分析,这对目前的病理缺口是有效的补充,更能对临床科研提供巨大的帮助。
陈其平说:“PerkinElmer大数据平台支持从组织、细胞、分子、蛋白质、基因从宏观到微观实现多层次多因素分析,实现科研数据深刻洞察。并能够为各大医学实验室提供了数据分析平台并发表了很多高质量的文章,目的是为用户提供手段,实现真正的数据探索。作为为全球25强药企研发提供大数据解决方案、为美国16强情报机构中的6家提供数据分析方案、为全球10强石油与天然气公司提供数据分析并为前5强研究机构提供数据分析的知名企业,我们正在为数千万候选新药提供筛选分析服务而不断努力。”