【论文精选】临床数据中心的构建与应用
1 引言
随着科技的发展,各种医疗观察、监测、评估、干预手段使得患者在院内、院外、各类医疗服务机构内产生的数据日益丰富,而这些数据与生俱来就存在异构、分布式、碎片化特点。这与临床医务人员需要全面、细致、准确的掌握患者数据,并构建临床数据分析综合能力之间形成了现实矛盾。因此,建立整合的临床数据中心成为未来支撑临床诊疗过程的必由之路。
首都医科大学天坛医院经过三年多时间的平台系统建设,已实现对医院现有门急诊挂号系统、门急诊处方系统、住院登记系统、住院医嘱系统、检验信息系统、医学影像信息系统、电生理系统、手术麻醉系统、电子病历系统等十多个业务信息系统间数据的无缝整合,将患者在医院业务全过程中发生的各项信息数据,按照临床过程组织汇集存储到临床数据中心,形成临床可实际利用的宝贵数据资源。
2 信息技术及建设方法
2.1 临床信息整合需求 患者疾病的发生发展涉及社区卫生、院前抢救、急救转运、急诊、住院、手术、康复等环节。疾病过程中针对疾病的观察、评估、干预等的数据产生,异构分散在不同机构的不同信息系统中。临床数据中心的建设需要把这些数据进行整合,形成与患者个体对应的病例数据资源(见图1)。
图1 整合的临床数据中心
2.2 各业务系统的数据整合 通过初期长达三个多月的各系统、各时期数据梳理、相同业务异构数据的梳理,建立了临床数据业务整合任务队列。按照分系统、分时间段、由近及远,由核心到周边的原则建立了整合任务清单。后期在数据分析利用过程中,再基于应用需求驱动制定临床数据补充计划。目前已完成十多个业务系统2012至今的数据整合。
2.3 临床数据中心的数据存储 十多个不同业务系统的数据分别由关系型数据库、文本文件、二进制文件、XML文件等多种方式存在。临床数据中心将其统一转化为基于HL7 RIM模型的标准化存储。标准化后的临床数据通过基于事件、主数据相关的唯一索引进行面向临床事件逻辑的索引化时间序列存储。
2.3.1 结构化数据的组织与存储 涉及窗口业务的大量临床数据均存储于关系型数据库中,大量临床过程中的相关事件数据集中存储在同一表的行记录中,如挂号记录、挂号计费记录、医嘱申请、医嘱生成、医嘱执行等。
临床数据中心的数据适配器组件中将源系统数据完整整合到数据中心后,进行标准RIM模型适配,完成RIM模型的标准化转化,同时参照业务逻辑进行术语的标准化映射与转化,建立参数者与主数据间的映射。
2.3.2 文档数据的组织与存储 电子病历系统、护理系统、手术麻醉系统存在大量基于文档的数据,各个不同系统分别采用了文本文件、XML文件、CDA文件或关系型数据库进行文档的存储。如病程记录、手术记录、护理记录等,并在各个业务系统中存在大量不同使用场景下产生的文档,涉及到文档类型大概达58种之多。
临床数据中心在整合过程中按照HL7 CDA的标准,根据来源系统的实际情况按照不同级别进行CDA文档转换进行文档标准化,实际过程中二进制文件被转换为Level 1,文本文件转化为Level 2,而XML文件和符合CDA规范的文档按照CDA Level 3进行标准化后进行存储。同样需要按照上文提到的建立参与者与主数据之间的映射。
2.3.3 非结构化数据的存储 来自RIS/PACS系统,LIS系统的部分数据存在图像化的非结构化数据,其对应的报告数据完成结构化、文档化数据存储后,将建立报告文档数据与其非结构化数据之间的映射存储。
2.4 临床数据中心面向应用的指标分析引擎 面向过程的临床各项应用,均需将临床行为过程进行指标分析。无论应用所面向目标是临床质量、科研分析还是精细化运营分析,都要将各类主观或客观的临床数据进行加工计算。每一项指标依据客观数据(参与者数据、事件数据)按照分析要求进行独立计算。一种疾病的过程行为与质量分析,需要依赖几百上千项数据复合计算得出,累计出院的十多万份病例均需独立进行计算,同时分析出所有的指标结果,对数据分析计算引擎提出了考验。而基于Map-Reduce的大数据分析技术,在速度与效率上都为数据应用的效果提供了充足动力。
3 临床应用与利用方法
3.1 面向过程的临床行为质量分析 天坛医院作为国家卫计委神经内科医疗质量控制中心的依托单位,一直致力于探索一种客观、有效、可溯的临床医疗质量监测模式,使病种质量监测分析工作尽可能减少对临床工作的额外负担,直接依托临床过程中产生的大量客观性数据资料,基于分析计算准确、客观的反映临床治疗实际状况,为临床质量的持续改进提供有效的数据支撑。
构建出面向过程的质量指标体系后,面向问题导向进行指标数据的分析展示页面设计。从病例特征到结果指标的分析展示,以及评价指标的过程数据展示,逐层将影响评价指标的环节数据一一展示出来。仅脑梗死一个病种,为支撑最终的20多项评价指标,需要完成近120项左右的环节数据进行支撑(见图2)。
图2 医疗质量指标监测分析平台病种导航界面
通过两年的应用建设期,建立了以脑梗死为代表的临床过程质量分析(见图3)。通过每份病案的过程指标分析评价模型与病种全体样本的群组指标分析模型进行了质量评价,并取得良好效果,得到了质量控制中心用户的高度评价。其后逐步推广到其他病种,如剖宫产、急性心肌梗死、社区获得性肺炎等。
图3 医疗质量指标监测分析平台病种检测指标界面
3.2 基于病种的临床科研数据分析 整合后的临床数据要发挥重大作用,必须针对数据进行详尽深层次的挖掘与分析。而临床科研需求必然成为整合后的临床数据中心支撑的重点方向。
临床科研主要面向主要疾病的发生发展特点,分型、评估的方法,临床过程的影响因素,变化趋势,不同预后的风险与影响因子,各类预防、干预、治疗、康复措施的有效性、适用性,以及各类临床数据之间的关联关系。面向疾病的临床科研分析需要将按照疾病的发生发展周期进行组织,并依据发展过程中的相对时间分析断面进行数据的重整与计算。以专科主要研究疾病方向建立病种资源库,按照要求以临床分析断面为基础,建立了大量的科研分析指标体系。这些分析指标实现了分别覆盖患者疾病发生发展的各个时期,并建立了开放式检索工具。
基于近三年的经验积累,目前已建成每年支撑建立4-5个病种资源的分析能力。
4 问题与挑战
4.1 临床数据采集碎片化 临床医务人员在既往的数据利用过程中,由于传统科研的登记模式思维,较易将数据获取需求、数据展现需求、数据计算需求、数据分析需求进行混淆。这就需要我们引导帮助临床医务人员理清实际的数据获取需求,并将来源数据采集进行碎片化,变集中为融合。
4.2 数据分析与应用实时性 随着临床分析应用的数据获取能力提升,临床医务人员逐步提出希望基于分析数据指导临床过程进行相应干预。这对临床数据中心提出了更高要求,对数据整合、数据分析的实时性,业务干预的及时性提出了新的要求。大量数据分析的性能需求和实时性之间将是新的挑战和考验。
4.3 数据分析文化体系建设 基于临床大量数据的综合分析较之基于业务系统报表的数据分析方式发生了巨大变化。新的数据应用分析更多面向过程、相关性分析,观察整体或特定群体的特征、趋势、变化和影响因素分析。这需要有全局性的数据分析思路与眼界。而医院内部构建相应的组织机构以适应新的变化,也将是医疗机构自身的一项新挑战。
5 展望与讨论
覆盖医院方方面面的数据整合后,随着分析应用的不断深化使精细化分析、过程分析及相关性分析成为可能。临床专家将不断在此基础上衍生出新的信息化需求。未来,从数据来源方面,将逐步引入患者端数据;从数据分析能力方面,将加强半结构化数据的基于语义的分析能力;从分析应用方面,将在临床决策辅助、管理运营大数据分析[6]、智能化关键事件监测预测分析等方面发展,使我院数据综合利用能力不断得到深化与拓展。
(来源:节选自《中国数字医学》杂志2016年第8期 作者:林琳 白波 王韬 单位:首都医科大学附属北京天坛医院)