信息集成平台与大数据平台的区别

2019-06-26 10:22:29 爱德腕带 阅读

QQ截图20190626102108.png

医疗信息集成在我国医院信息化的发展中,已经落地实施了将近十年。这十年间,信息集成平台的建设,从一、两家的最佳实践案例到全国医院的大规模实施,再到国家卫健委的互联互通标准化测评,已经经过了行业内的充分论证与实践,取得了蓬勃的发展。

       伴随着医疗信息集成平台的逐步稳定与成熟,在集成平台与临床数据中心的基础上,医疗大数据平台这个概念应运而生,而作为一个新生的概念,它的外延与内涵并没有清晰的定义。信息集成平台与医疗大数据平台两个概念经常单独或者相伴出现,以至于行业厂商甚至是医院信息化工作者,也时常混淆。

       本文结合以往实际工作经验及未来设计理念,从几个层面来厘清两者的联系与区别,分析两者的概念、特点、关联与未来发展方向。

二者概念不同

        医疗信息集成平台:严格地说,集成平台应该是技术平台,即基于ESB总线的数据交换平台,而医疗信息集成平台通常指包含与集成相关的一系列内容,包括:术语标准的建立、标准业务流程的梳理、集成技术体系的统一、集成调度与管理、临床数据中心的设计与搭建,以及基于临床数据中心之上的一系列数据应用等。

        医疗大数据平台:是基于大数据技术构建,面向数据分析业务的应用平台。通过数据采集、清洗、建模、归一、标准化等数据处理,形成可作为临床、科研、管理分析业务支撑的大数据应用与分析平台。

信息集成平台与大数据平台的区别

        信息集成平台与大数据平台的差异性主要体现在两个维度:一是技术性的差异,二是面向业务分析的差异。

        从技术角度看,信息集成平台较多使用传统技术,大数据平台则采用诸如大数据处理、机器学习甚至是深度学习等新技术,来解决以前难以解决或者无法解决的问题。比如以前处理数据需要几个小时或者几天的时间,大数据平台可能几分钟甚至几秒钟就处理完毕;以前病历文本中的内容难以利用,通过大数据、自然语言处理的技术,现在可以实现秒级、毫秒级响应。

        从业务角度看,信息集成平台更面向临床应用,对数据准确性要求更高;大数据平台更面向科研,对数据要求量大。

        以下是信息集成平台和大数据平台各个层面的区别:

        1.数据采集模式:数据采集指从业务系统获取数据的手段与方式。信息集成平台采用集中的ESB引擎,由业务系统主动发出数据提供给平台,或者由信息平台从业务系统的ODS数据库里获取数据。而大数据平台因为对数据的利用要求,往往不以实时为目的,多以ETL方式来获取数据。

        2.数据清洗要求:信息集成平台临床数据中心(CDR)的数据采集,其目的是准确记录医疗数据的原始状态,作为全院医疗数据的一个归总集合,基本不做清洗工作。医疗大数据平台由于其应用特性,要对数据做加工整理,如数据的溯源关系链、隐私脱敏、后结构化处理、数据画像等工作。

        3.数据传输时限要求:信息集成平台担负着医院跨业务系统之间的业务联动功能,信息平台的运转要保障医疗工作的连续运行,因此,传输模式要求是实时或者是准实时模式。大数据平台应用在科研方向,更重视对数据的整合价值、统计价值的使用,因此,最早的大数据平台的数据采集要求可以用T+N的离线模式即可。不过,在当前“批(批处理)流(流处理)合一”的发展趋势下,大数据的处理能力加强,大数据的应用逐渐由离线处理向近线处理转变,至于发展的节奏取决于投入产出比是否合理、业务需求是否迫切等因素。

        4.数据库的选取:信息集成平台与临床数据中心初期主要使用关系型数据库,其核心诉求是要保障数据的完整性和一致性,确保数据不会因为软硬件故障而遭到损失。此外,随着交互量的增加,数据的联机处理量级和效率也成为一个重要的考虑。一些医院为提升联机事务的处理效率,引入分布式数据库以满足互联网流量下高并发访问的需求。大数据平台阶段,由于关系型数据的设计容量有限,需要联机处理的快速高效,因此设计上会采用分布式可扩展的技术架构,例如通过Hadoop、Spark等技术保障,对整个集群容量和处理能力进行无缝扩展。

        5.数据利用:基于集成平台的临床数据中心的建设,数据利用符合了医院医疗业务的实时查看需求,它将一个患者在某一医疗机构内发生的所有临床活动所产生的临床文档集中放置在一个物理存储内,方便各种临床业务角色在使用该患者某些临床活动的病历文档时进行调阅,或者嵌入诊疗系统,以按需提供的方式来支持实时的诊疗活动。临床数据中心将不同厂商的异构数据进行以患者为中心高度整合,以患者EMPI为主线组织数据,实现患者临床数据的模型化存储,基于临床知识库,辅助临床决策,提高临床诊疗效率和质量。

       大数据平台的数据通过平台对数据的采集、清洗、建模、归一、标准化等处理,为临床、科研、管理分析业务提供支撑。更多体现在科研应用,包括临床试验数据分析、个性化治疗、疾病模式的分析;在医药研发方面:通过医疗、医药大数据,利用人工智能深度学习能力的算法系统,对研发药物中各种不同的化合物以及化学物质进行分析,预测药品研发过程中的安全性、有效性、副作用等;以及在基因大数据、健康管理、医药保险等各方面统计数据层面的利用。

统筹兼顾,总体规划

        医疗大数据平台与医疗信息集成平台之间,既有纵深的继承关系,又有着进一步扩展和延伸。从用户角度来看,有部分功能是重叠的,因此容易产生疑惑。

        在现阶段医院信息化规划中,不可将两者割裂开,而是要综合考虑顶层设计,当然设计时不仅要考虑厂商的实现能力,也要考虑医院的现有架构。

        如果是全新的设计,可以包括但不限于以下方面的规划:

        1.统一的底层数据架构设计:为数据库ODS层设计的统一,既服务于临床数据中心,又服务于科研数据中心。

        2.统一数据平台产品的设计:既包含已有CDR数据展示的设计,又有对非结构化数据等科研应用的展示与分析。实现对于业务数据的封装和开放,快速、灵活地满足上层应用的要求,通过元数据管理、数据质量治理等活动,不断实现数据价值最大化。但此设计的前提是,硬件计算平台的架构、计算模型的框架、共性技术等的进一步提高,才会越来越满足医疗大数据的大规模高复杂性应用。

        综上分析,医疗大数据平台并不是平地而起,一个新生事物的出现总是有前序基础的铺垫。信息集成平台发展到了一定程度之后,其技术环境不能满足需求的扩张,于是出现医疗大数据平台。相信在不远的未来,这两个平台也会更好地融合,为医院用户提供更便利的应用。


点击这里给我发消息
点击这里给我发消息