大型三甲医院临床数据中心系统的建设与应用
1 背景
随着医院信息化建设发展,临床和管理信息系统积累了大量数据,但由于医院信息系统的复杂性和多样性,导致各系统间数据分散,标准不一致,难以实现交换和共享。为推进信息标准化工作,促进标准的规范和实用,实现分散数据资源的集成和利用,建立一体化的信息集成平台成为迫切需要解决的问题。
在对我院临床、研究、运营管理、患者服务和区域协同管理整体规划基础上,构建了基于SOA架构的全院信息交互平台,实现了分散系统间的数据集成、交互与融合,建设全院级别的临床数据中心(Clinical Data Repository,CDR),为我院未来一段时期内信息化发展奠定坚实基础。
2 CDR系统建设思路
基于患者主索引对医院患者信息的整合,建立以患者为中心的临床数据中心,为医生在临床诊断时提供综合的决策信息支持,同时为医院科研分析提供病历筛选和数据分析的模型支持。
2.1 建设标准
2.1.1 HL7V3标准 美国卫生信息传输标准Health Level Seven(HL7)是由美国国家(ANSI)批准颁布实施的医疗卫生机构及医用仪器、设备数据信息传输的标准,目前已成为医疗领域的国际标准。2000年,HL7组织发布了HL7最新的3.0版本标准,其中枢部分参考信息模型RIM(Reference Information Model),定义了包括100多个类和800多个属性定义及类之间的映射关系。它给出的是一个灵活的HL7结构,而不仅仅是对数据进行详细定义,这些特性使HL73.0真正成为可描述和可测试的医疗信息技术标准。我院在设计临床数据中心各类服务消息的过程中,严格遵守HL7 V3的RIM模型,充分考虑临床业务的多样性和可扩展性,以及与其他业务系统的整合及数据共享等,以建设更加开放共享的临床数据中心,更好地辅助医务人员完成临床业务,实现多系统的整合与集成。
2.1.2 CDA标准 临床数据共享是整合医院内部异构系统、构建以电子病历为核心的统一临床数据中心的重要手段,CDA继承了HL7 RIM3和HL7 3版发布的数据类型。基于CDA标准的信息采集、传输和存储是实现临床医疗文档跨系统交互、提高临床质量的技术保障,结合CDA文档架构对临床文档的结构和语义进行标准化和本地化定义,实现数据的结构化存储、异构系统间的通信和数据交换。我院在CDR建设中,严格遵循HL7、CDA标准,设计了41种类型的CDA服务,具体如表1所示,基本涵盖了临床常用的交互信息。
表1 江苏省人民医院CDA类型说明
2.2 网络架构 CDR系统包含8台服务器,其中两台数据接收服务器,主要用来实现平台队列消息的解析和存储,服务器对内存和处理器要求配置较高;一台CDR文件服务器,用来存储接收的大量CDA文档,服务器需配较高的硬盘空间;两台数据库服务器,一台做主机,一台做实时备份,采用GoldenGate技术进行实时同步备份;两台应用服务器,为保证客户使用系统的流畅性,采用F5负载均衡技术进行任务的计算分配,具体服务器网络架构参考图1。所有服务器均部署Redhat linux操作系统,数据库采用Oracle database 11gR2,应用程序采用Tomcat技术实现。
图1 CDR网络架构图
2.3 关键技术
2.3.1 集成平台技术 采用IBM公司面向医疗行业的企业服务总线产品(IBM Integration Bus,IIB),构建SOA/EDA混合集成架构,通过引入集成引擎产品,将原有的点对点互联方式转化为服务提供系统/集成平台/服务消费系统的三点连接模式,降低系统互联复杂度,使服务(接口)基于集成平台,易于复用、管理和监控。
2.3.2 备份技术 GoldenGate软件是一种基于日志的结构化数据复制软件,它通过解析源数据库在线日志或归档日志获得数据的增删改变化,再将这些变化应用到目标数据库,实现源数据库与目标数据库同步、双活。CDR数据库服务器采用GoldenGate技术实现实时双活备份,一旦主数据库宕机,可由备份数据库及时恢复。
2.3.3 负载均衡 负载均衡是一种通过算法实现负载分担的技术,对统一分配请求的设备,负载均衡会统一接收全部请求,然后按照设定好的算法将这些请求分配给负载均衡组中所有成员,以此来实现请求(负载)的均衡分配。本院利用F5负载均衡器对CDR系统的应用程序进行访问任务自动分配,从而保证整个CDR系统的高可用性。负载均衡特性和客户端自动路由功能可以保证在单节点出现故障的情况下,应用程序继续访问其他节点,整体数据库系统达到持续的可用性。
3 本院实施及应用情况
3.1 实施情况 该项目于2014年4月启动,历时一年半左右,2015年12月正式上线,产品基于集成平台实现,符合HL7 V3标准设计,多维度展示患者就诊信息,并提供预警功能,辅助医护人员进行查询决策。系统集中存储包括就诊、诊断、医嘱、检查、检验、手术、病历、手术等患者关键的临床信息,接入系统涵盖医院HIS、电子病历、PACS/RIS、检验等31个临床信息系统。现已存储2005年9月至今的门诊数据和2006年5月至今的住院数据,部分数据类型及周期列举见图2,目前CDR中包含547万条患者记录,4.1亿条临床文档,共1.5TB数据量,为后续医、教、研、管奠定坚实基础。
图2 CDR中数据类型及周期说明
3.2 应用情况
3.2.1 系统应用形式 目前CDR支持多种使用形式,可通过浏览器直接访问地址打开系统,直接利用就诊卡号或住院号检索患者存储信息,查阅患者就诊记录、医嘱记录、检查报告、检验报告、病历文书等详细临床资料。同时,为便捷CDR系统的使用,使用户在多个场景下快速查阅到患者信息,CDR与多个系统对接,在单点登录系统,HIS、门诊电子病历、病理、样本库、医保管理等系统中实现快速访问,利用就诊卡号、用户、系统编号等信息直接打开关注的患者就诊界面,同时在CDR系统的用户登录日志表中记录系统访问情况,此种方式拓宽了CDR系统的使用场景,便捷了登录方式,给各系统各角色人员提供了快速访问临床数据中心的方式,可以在临床、管理、科研工作中多点进行信息查阅,提供全面的支持。
3.2.2 用户权限控制 系统支持灵活的权限控制方式,可根据登录人员的角色分配不同权限,支持六种类型的权限配置,分别为:访问我的患者信息;访问本科室门诊患者信息;访问本科室在院患者信息;访问全院患者信息;访问本科室出院患者信息;访问VIP患者信息。目前通用的设置是根据登录医生的归属科室,开通对应的科室患者就诊数据访问权限,当查询的患者不是本科室病人时,提示用户没有权限进行访问。部分用户对CDR系统有数据调取需求,基于CDR系统建设数据查询平台,同时参考医疗信息安全制度、患者隐私保护措施,完善数据管理调取流程,落实全院数据共享机制。
3.2.3 临床应用 CDR集成院内各临床应用系统所有数据,将患者在院内发生的所有临床活动产生的临床数据集中存储在一起,医护人员通过用户交互界面,查看以患者为中心的全生命周期临床数据,对患者情况进行综合分析,辅助临床决策。CDR是电子病历的基础,是一个实时的数据库,帮助医务人员处置患者临床信息,可针对单个患者进行检索,也可将关注的患者进行检索,提供临床数据的存储、管理、数据维护和数据服务功能,同时为科研工作奠定基础。
3.2.4 科研应用 CDR系统收集了大量临床数据,在多个系统中可供科研人员直接访问。同时,在CDR基础上建设面向专科的单病种科研系统,实现科研入组患者已有临床数据的自动采集,减少用户录入工作量,入组患者在医院中的就诊信息、检验报告、检查报告等都可从CDR中直接获取,大大提高科研患者管理效率。图3介绍了专科单病种科研系统架构,CDR数据库与科研系统的数据库深度对接,大量临床信息直接抓取利用。
图3 专科单病种科研系统架构图
4 问题与思考
临床数据中心的建设是一项持续工作,随着信息化的覆盖面越来越广,接入的临床数据将越来越多,CDR是各类临床信息系统关键信息的大集合,其建设质量与源系统的数据质量密切相关。在大力推动CDR建设过程中,源系统的质量控制也非常重要。
CDR中整合了患者在医院诊疗期间所有的诊疗信息,涉及个人基本信息、病史等隐私数据。在系统建设过程中要加强安全性建设,保证患者数据有效保护,在与其他系统对接时,患者隐私相关数据必须进行脱敏才能分享,建立良性的数据共享机制,在有效辅助医、教、研、管工作的基础上保护患者利益。
随着CDR中大量临床数据的接入,各类标准的CDA文档越来越多,数据量也越来越大,为提升CDR数据库运行效率,本院采用文件形式存储CDA,而在CDR数据库中仅存储对应文件在服务器上的文件存储路径。本院41类标化的CDA文件如何使用,目前提出两种模式:一是将标化后有规范数据元的CDA文档解析到二维表中,供其他系统直接使用;二是利用Hadoop技术,将存储的文件做并行计算,挖掘出提升临床诊断治疗的深度信息,利用大数据分析发现医学研究新模式。
在该项目建设的基础上,围绕临床、教育和研究三方面深入大数据挖掘应用,开展临床医护一体化工作站、单病种科研管理、运营分析与决策管理系统等项目建设,建立一个融合完整患者信息、真正面向临床全流程质量控制和决策支持的信息体系,以及全方位高质量的生物样本库与临床信息大数据平台。
(来源:《中国数字医学》2016年10月10期,作者:缪姝妹 景慎旗 张小亮 朱甬倩 郭建军 张昕 王忠民 刘云,作者单位:南京医科大学医学信息学与管理研究所,南京医科大学第一附属医院(江苏省人民医院)信息处)