【医疗健康大数据论坛】陆慧菁:浅谈医疗大数据
一、定义
在不知不觉中,我们习惯在谈“数据”的时候前面都要加了一个“大”字,满目的“大数据”、“云计算”、“跨界”、“协同”、“融合”等字眼。对于大数据的特点很多人都会想到IBM给出的5V定义,在此借用5V定义结合医疗特点尝试定义医疗大数据的特点如下:
1、容量(Volume):应该包括所有人从出生到死亡的所有数据,建立个人的数据中心,将每个人的日常生活习惯,身体体征,社会网络,知识能力,爱好性情,疾病嗜好,情绪波动,基因筛查,将除了思维外的一切都全方位储存下来。
2、种类(Variety):医疗数据类型的多样性表现为结构化和非结构化数据、因系统更换频繁导致数据多为异构性数据、除了医疗数据外的生活数据以及监测数据,如:可穿戴设备产生的各种数据。
3、速度(Velocity):以加速度的方式获得数据,数据有效期长,不但以“年”为单位,更以“代”为单位。
4、真实性(Veracity):以往医疗数据分为主观数据和客观数据,主观数据大部分来源于医护人员根据患者口述后进行医学术语描述,客观数据包括了检查、检验结果数据,目前增加了个人管理数据。
5、价值(value):医疗大数据合理运用,为人类带来不可估算的价值,如:疾病防控预测、精准医疗等方面。
二、建立医疗大数据平台应思考的几个问题
对于医疗大数据,随着数据逐渐成为医院或者说医疗部门的一种资产,数据产业会向传统医疗机构的供应链模式发展,最终形成“数据供应链”。 外部数据的重要性日益超过内部数据。在互联互通的互联网时代,单一医院的内部数据或者区域医疗收集到的数据与整个互联网数据比较起来只是沧海一粟,应该由权力机构去主导数据供应、数据整合与加工、数据应用等多个环节服务,分权给相应部门使用。在建立医疗大数据时应注意以下几点:
1、精准与容量之间的选择
Globys公司的Olly Down曾经说过,现在,很多公司都倾向于收集精度较高的数据,因为获得的数据越精确,就越有利于分析受众群体,也更有利于公司进行相关战略和产品的调整。不过,公司往往需要花费大量的时间去处理大量的数据,结果却有可能不尽如人意,所以,在进行数据分析处理时,有时候没有必要执着于某一棵“树”长成什么样子,而应该注重这片“森林”,要懂得舍小取大。
对于医疗数据此种说法是否正确?医疗数据不同于一般的生活数据以及购买行为数据,精准和容量同样重要。对于医院来说需要逐步精准的记录每一个患者的医疗数据,结合生活数据及行为数据后再作出个人的各种预测,也就是现在流行的说法“治未病”,给每一个人更多的生活指导意见。而站在国家的角度,医疗数据具有战略意义,大数据离不开云计算,云计算离不开平台建设,做好顶层设建立数据平台,充分考虑容量及计算方式,分布式计按区域把医院提供的医疗数据与个人数据、商业数据以及政府数据相结合,脱敏后授权相关机构使用。
2、个人隐私与数据共享的矛盾
中国并没有专门的法律法规来界定用户隐私,处理相关问题时多采用其他相关法规条例来解释。但随着民众隐私意识的日益增强,合法合规地获取数据、分析数据和应用数据,是进行大数据分析时必须遵循的原则。
个人隐私与数据共享本身存在一定的矛盾性,我们尽量避免合理数据的非法使用,可以从几方面作出规范:一方面对于个人数据采用授权方式征集;另一方面可以采用脱敏后使用。每个个体、机构都希望能够得到数据,但又害怕自己所拥有的数据被窃取,如何达到一个平衡点需要相关政府机构起主导作用,建立共享机制。如:建立医疗云、教育云、电子政务云等不同行业的云平台,各云平台间建立认证机制,并支持跨行业使用有关数据。
3、数据采集的方式
数据的收集方式有很多方法,对于一般的生活数据或者说上网行为数据可以根据人们上网主要浏览的网页,或者主要搜索的关键字,看出人们对什么东西感兴趣,也可以根据人们在社交软件上面的聊天记录来收集有用的信息,还可以通过做网页上面的答卷来收集信息,知道人们对于一种东西的看法和态度。对于医疗数据的采集,应打破传统的病历医嘱等数据收集模式,让我们大胆设想几个场景:
场景一,传感器的应用:虽然我们现在重视病历书写,使用各种方式采集结构化数据,但客观上有些数据我们无法精确,比如询问病人喝水,在病历上能做到的只是询问一天喝水量是多少,喝水的次数,喜欢喝白开水还是饮料,如果是饮料是什么方面的饮料。但如果我们使用一个有传感器的杯子,能感应每次装的水有多少,还包括水温,采集每次喝水的时间以及容量。-------让我们能在不知不觉中精准的采集到有用数据。
场景二,患者身份标识:仿照互联网公司的数据分析方式,从购买行为上把消费者定位,放在购物篮的货物从颜色、款式喜好、身高体重以及生活习惯、收货地址的消费水平、是否养宠物等作出标识。对于患者慢性疾病分型、曾用药物疗效、过敏情况、家族史、生活习惯等情况不再只从患者口中得到,而是客观的从各方面数据中提取分析而来。--------深层次的挖掘出患者自己都不注意的隐性特征。
场景三,数据定位:目前我们发现在登录一些网站注册时不再只是单调的注册一个用户,而是可以选择使用微信、支付宝、QQ等多种授权方式,在授权的同时我们已经关联了很多用户信息,并且做到了信息共享。我们是否可以利用这种方式把更多的生活数据与医疗数据相合并,自然捕捉有针对性的与医疗相关性有用数据及社会关系网。--------不再只是患者时间轴,而是网状图甚至是立体多维结构。
三、展望
有人说大数据思维是从样本思维转向总体思维、从精确思维转向容错思维、从因果思维转向相关思维,对于医疗大数据远不只以上思维方式的转变,更是推翻自我重塑知识体系的过程。大数据的应用为我们看待世界提供了一种全新的方法,我们在摸索中前进。
(作者单位:广州医科大学附属第二医院)
标签:   医疗健康大数据