首页 百科知识 大数据应用

大数据应用

时间:2022-07-03 百科知识 版权反馈
【摘要】:研究型医院数据化全面采集个体健康数据,形成具有跨区域收集、时间连续,以病例为核心的面向科研应用的临床数据。(一)数据化应用研究型医院数据化应用工具主要有搜索引擎、智能检索工具、数据挖掘工具、可视化工具、三维重建与模拟仿真工具。技术元数据是数据仓库的设计和管理人员用于开发和日常管理数据仓库时用的数据。

研究型医院数据化全面采集个体健康数据,形成具有跨区域收集、时间连续,以病例为核心的面向科研应用的临床数据。使用智能型的检索工具,实现多维度检索、筛查及复杂的数据挖掘;使用专业性数据可视化工具,以图表、图形、图像方式实现数据融合显示,从多维度、不同视角观察数据;使用虚拟现实和模拟仿真技术,融合多种来源信息,以影像方式实现客观对象的重建,从多层面观察了解客观对象,使用多参数模拟客观对象的变化。这些应用为临床科研工作开展提供了强有力的支撑。

(一)数据化应用

研究型医院数据化应用工具主要有搜索引擎、智能检索工具、数据挖掘工具、可视化工具、三维重建与模拟仿真工具。

1.商业智能应用 商业智能(Business Intelligence,BI)是指通过对数据的抽取、转换、融合、分析使数据成为可用的信息,通过直观、更好地理解的形式,获得必要的洞察力和理解力,更好地辅助决策和指导行动。

BI是数据仓库、联机分析处理和数据挖掘等相关技术走向商业应用后形成的一种应用技术。它主要处理数值型数据,用于发现数据间关联关系。

医院商业智能系统由三个子系统组成,即医院联机分析数据仓库系统、决策支持系统和报表查询系统。决策支持系统提供医院运营分析、医疗质量分析、人员绩效分析、设备效益分析;报表查询系统提供运营状况报表、质量分析报表、绩效报表、物资情况分析报表、院感分析报表、合理用药报表等。

通过采集医院HIS、LIS、PACS等业务系统数据,进行信息匹配、转换、加工和融合形成联机分析数据仓库;进行数据动态分析,通过钻取(roll up和drill down)、切片(slice)和切块(dice)、旋转(pivot)、交叉钻取(drill across 和drill through)等功能实现对数据仓库的动态访问;多角度呈现分析数据,分别按患者层面、科室层面、时间层面、费用层面及物资层面展现质量、绩效、住院、门诊、用药等分析结果;展现形式以驾驶舱方式,集仪表盘、警示灯、数据表为一体,直观、易理解,让决策者方便迅速决策。

(1)BI系统逻辑架构。医院BI系统逻辑架构是一种开放式的系统架构,如图13-16所示。从这个架构中,可以比较清楚地看出目前BI架构的模式,包括数据层、业务层和应用层三部分。数据层基本上就是ETL过程。业务层主要是OLAP和Data Mining的过程。在应用层里主要包括数据的展示,结果分析和性能分析等过程。

图13-16 BI的基本过程

(2)BI的数据存储技术——数据仓库(DW)。数据仓库是一个过程而不是一个项目;数据仓库是一个环境,而不是一件产品。数据仓库提供用户用于决策支持的当前和历史数据,这些数据在传统的操作型数据库中很难或不能得到。数据仓库技术是为了有效的把操作形数据集成到统一的环境中以提供决策型数据访问的各种技术和模块的总称。所做的一切都是为了让用户更快更方便查询所需要的信息,提供决策支持。

①数据仓库的组成

数据仓库数据库:数据仓库的数据库是整个数据仓库环境的核心,是数据存放的地方和提供对数据检索的支持。相对于操作型数据库来说其突出的特点是对海量数据的支持和快速的检索技术。

数据抽取工具:数据抽取工具把数据从各种各样的存储方式中拿出来,进行必要的转化、整理,再存放到数据仓库内。对各种不同数据存储方式的访问能力是数据抽取工具的关键,应能生成COBOL程序、MVS作业控制语言(JCL)、UNIX脚本和SQL语句等,以访问不同的数据。数据转换都包括:删除对决策应用没有意义的数据段;转换到统一的数据名称和定义;计算统计和衍生数据;给缺值数据赋给缺省值;把不同的数据定义方式统一。

元数据:元数据是描述数据仓库内数据的结构和建立方法的数据。可将其按用途的不同分为两类,技术元数据和商业元数据。技术元数据是数据仓库的设计和管理人员用于开发和日常管理数据仓库时用的数据。包括:数据源信息;数据转换的描述;数据仓库内对象和数据结构的定义;数据清理和数据更新时用的规则;源数据到目的数据的映射;用户访问权限,数据备份历史记录,数据导入历史记录,信息发布历史记录等。商业元数据从商业业务的角度描述了数据仓库中的数据。包括:业务主题的描述,包含的数据、查询、报表。

元数据为访问数据仓库提供了一个信息目录(information directory),这个目录全面描述了数据仓库中都有什么数据、这些数据怎么得到的和怎么访问这些数据。是数据仓库运行和维护的中心,数据仓库服务器利用它来存贮和更新数据,用户通过它来了解和访问数据。

访问工具:为用户访问数据仓库提供手段。有数据查询和报表工具;应用开发工具;经理信息系统(EIS)工具;联机分析处理(OLAP)工具;数据挖掘工具。

数据集市:为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据。在数据仓库的实施过程中往往可以从一个部门的数据集市着手,以后再用几个数据集市组成一个完整的数据仓库。需要注意的就是再实施不同的数据集市时,同一含义的字段定义一定要相容,这样在以后实施数据仓库时才不会造成大麻烦。

②数据仓库的ETL:ETL是数据抽取、转换、加载的简写。它的一般过程是将数据源抽取出来,中间经过数据的清洗、转换,最后加载到目标表中(图13-17)。

图13-17 数据仓库的ETL过程

数据抽取:数据抽取就是从源系统中获取业务数据的过程。数据抽取时需要考虑很多的因素,如抽取时间、收取方式、抽取周期等。数据抽取有以下几种情况:如果业务操作系统数据库和数据仓库质检的数据库管理系统完全相同,只需要建立相应的连接关系就可以使用ETL工具直接访问,或者调用相应的SQL语句或者存储过程。若数据仓库系统和业务操作型数据库的数据管理器不相同,比较简单的方式是使用ETL工具导出成文本文件或者Excel文件,然后再进行统一的数据抽取。如果需要抽取的数据量非常的庞大,此时必须考虑增量抽取。

数据清洗:数据清洗就是选择出有缺陷的数据,然后再将它们正确化和规范化,从而达到用户要求的数据质量标准。

数据转换:数据转换就是指从业务系统中抽取的源数据,然后再根据数据仓库模型的需求,进行一系列数据转换的过程。数据转换是ETL过程中复杂度最高的过程,包括对数据不一致性的转换,业务指标的计算和某些数据的汇总,为决策系统提供数据支持。

数据加载:需要保证加载工具必须有高效的性能去完成数据加载,同时还需要考虑加载的周期和数据加载的策略。数据加载包括:时间戳的加载方式,是比较常见的一种加载方式,全表对比的加载方式、通过读取日志进行加载的方式、全表删除后再进行加载的方式。

ETL日志:ETL日志非常重要,它记录了ETL执行过程中的每一步信息,帮助系统维护人员进行监控。

(3)BI的数据分析技术—OLAP。OLAP即联机分析处理。联机分析处理系统是数据仓库系统最主要的应用,专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握医院的经营状况,了解对象的需求,制订正确的方案。

联机分析处理是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。决策数据是多维数据,多维数据就是决策的主要内容。OLAP专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握医院的经营状况,了解对象的需求,制订正确的方案。联机分析处理具有灵活的分析功能、直观的数据操作和分析结果可视化表示等突出优点,从而使用户对基于大量复杂数据的分析变得轻松而高效,以利于迅速做出正确判断。它可用于证实人们提出的复杂的假设,其结果是以图形或者表格的形式来表示的对信息的总结。它并不将异常信息标记出来,是一种知识证实的方法。

(4)医院BI实施步骤。实施BI系统是一项复杂的工程,涉及企业管理、动作管理、信息系统、数据仓库、数据挖掘、统计分析等众多知识。因此,用户除了选择合适的BI软件工具外,还必须按照正确的实施步骤才能保证项目顺利实施。BI项目实施步骤如下。

①定义需求:需求分析是BI项目最重要的一步,需要描述项目背景与目的、业务范围、业务目标、业务需求和功能需求等内容,明确企业对商业智能的期望和需要分析哪些主题等方面。其中项目背景主要描述已有系统的当前现状,包括不同的历史时期,它的业务需求分别是什么。这些独立的信息系统的特点一般是缺乏统一的整体规划和标准,数据分散,每个业务之间不能共享信息,报表展示功能单一,各业务系统之间存在数据不一致的现象,医院领导层无法从全局的角度对业务进行综合分析等。

BI项目最重要的目的就是解决各个业务系统之间数据集中整合的问题,避免数据不一致的现象,为医院管理人员提供高效的数据查询和强大的报表展示功能,能够进行多维度的深入分析和数据挖掘,对企业未来的经营状况作出准确的预测。

②数据仓库模型的建设:模型是对现实世界的抽象。数据仓库模型是在需求分析的基础上建立起来的。数据模型的设计流程是:在系统设计开发之前,业务人员和设计人员共同参与概念模型的设计,核心的业务概念在业务人员和设计人员之间达成一致;在系统设计开发时,业务人员和设计人员共同参与逻辑模型的设计;最后设计人员以逻辑模型为基础进行物理模型的设计。

③数据抽取、清洗、转换、加载(ETL)

数据抽取主要负责将数据仓库需要的数据从各个业务系统中抽取出来。如果每个业务系统的数据情况各不相同,可能对每个数据源都需要建立独立的抽取流程。每个数据抽取流程都需要使用接口将源数据传送给下一阶段的清洗与转换阶段。通过数据抽取程序,可以从业务源系统中不断地将数据抽取出来。

清洗阶段是对业务源数据的清洗和确认,检查抽取的源数据质量是否达到数据仓库的规定标准。数据清洗大致有两种方式:一是不同业务系统间各自专用的清洗程序;二是不同业务系统间有满足数据仓库清洗需求的通用程序。从不同业务系统抽取的数据有可能存在数据不一致的情况,可以使用相关规则和标准检查业务源数据的质量。

转换是对源系统的数据做最后一步的修改,包括对源数据的聚合以及各种计算,是整个ETL过程的核心部分。

加载是将数据加载到最后的目标表中,其复杂度没有转换高,一般采用批量装载的形式。

④建立商业智能分析报表:商业智能分析报表通过对数据仓库的数据分析,使医院的高层领导可以从多个角度查看医院的运营情况,并且按照不同的方式去探查医院内部的核心数据,从而更好地帮助医院决策人员对医院未来运营状况进行预测和判断。

2.可视化与虚拟仿真应用 可视化的基本含义是将科学计算中产生的大量非直观的、抽象的或者不可见的数据,借助计算机图形学和图像处理等技术,以图形图像信息的形式,直观、形象地表达出来,并进行交互处理。医学数据可视化是可视化技术在非空间数据领域的应用,可以增强数据呈现效果,让医护工作者以直观交互的方式实现对数据的观察和浏览,从而发现数据中隐藏的特征、关系和模式,有利于进行科研创新和临床诊断。

可视化的数据分为以下几类:一维数据、二维数据、三维数据、多维数据、时态数据、层次数据和网络数据。CT、MRI、PE是一组二维断层图像,通过计算机重构人体器官或组织的图像,可以看到器官或组织的三维立体图像。超声、病理也同样可以形成二维图像。将多种模态的图像进行空间融合,可以准确地确定病变体的空间位置、大小、几何形状,以及与其他生物组织之间的空间关系,从而为科研和诊断提供准确的依据。

在虚拟仿真环境中,建立数字人模型,借助跟踪球、HMD、感觉手套,学生可以进行直观学习、操作训练、模拟手术;在虚拟仿真环境中,用个体的器官或组织信息代替数字人模型,医生可以进行手术推演、复杂手术计划安排、手术后果预测等应用。

3.信息检索 搜索引擎主要用于互联网上信息的收集,常用有百度、谷歌等。

智能检索工具是从自然语言处理,基于概念的方法、代理的方法和本体的思路实现信息的检索智能化。从检索内容划分,有基于文本的检索、基于图像的检索、基于多媒体的检索。主要用于病例资料的检索、信息资源库的检索。

它用于发现本体间的关联关系,如IBM的TextMiner工具。

(二)大数据医疗

在医疗上,研究型医院以健康管理为前哨、临床诊治为中心、康复医疗为后援的大健康观,在个体健康信息数据化上体现为个人健康档案和电子病历。

1.医疗大数据的主要来源

(1)电子病历。是医疗大数据首要来源,它是在医护人员对患者进行诊断和治疗中产生,以患者为中心构建。包括患者基本数据、入出转数据、电子病历、诊疗数据、医学影像数据、医学管理、经济数据等,是患者医疗过程的原始记录。

(2)个人健康档案。是医疗大数据的另一主要来源。它是生命个体的身心健康(包括正常的健康状况、亚健康的疾病预防健康保护促进、非健康的疾病治疗等)过程的规范、科学记录;是以个体健康为核心、贯穿整个生命过程、涵盖各种健康相关因素、实现信息多渠道动态收集、满足个体自身需要和健康管理的数据资源。它的数据来源于社区医疗、妇儿保健、健康体检等机构,通过区域卫生信息平台进行汇集、保存和交换。医院信息集成平台通过交换协议可以从区域卫生信息平台获得个体健康档案数据。

(3)医疗大数据的其他来源

①医院信息系统数据:它主要记录医院及其所属各部门的人流、物流、财流,围绕医疗活动的各个阶段产生的相关数据,包括门诊数据及病房数据两大主数据流,伴随这两大主数据流,又生成许多辅助数据,例如教学管理数据、科研管理数据、预防工作数据、医技科室数据、药房管理数据、财务管理数据、医疗器材管理数据、人事管理数据、物资管理数据等。

②实验室信息系统数据:实验室信息系统主要功能是将实验仪器传出的检验数据经分析后,生成检验报告,通过网络存储在数据库中,使医生能够方便、及时地看到患者的检验结果。其数据主要包括检验标本的流转数据、检验结果数据、相关仪器管理数据及人员考勤情况数据等。

③影像存储与归档系统数据:它主要是医院影像科室DR检查、CR检查、CT扫描、磁共振成像、多普勒超声波、内镜检查、解剖学、病理学、超声波心动描记术、各种红外仪、显微仪等设备产生的影像数据。

2.医疗大数据的特点

(1)数据量大。数据类型更加多种多样。如电子病案中关于人口学特征的数据为纯文本型;检验科中有关患者生理、生化指标为数字型;影像科中如B超、CT、MRI、X线片等图像资料。传统医疗数据只考虑结构化数据,大数据时代非结构化数据这种比结构化数据大的多的医疗数据带来了存储量大、计算量大的新问题。

(2)数据多样性。以患者为中心,结构化和半结构化、标准化和非标准化并存。多样性还体现在医疗数据的完整性和综合性,大数据所包含的医疗数据不仅包括医院通过自身服务所获得病员、医生和护士的各项数据,还包括患者个体在医院自助时创造的数据;同时,信息来源单位,还有其他社会的、经济的、政治的、自然的方方面面的数据。

(3)医疗数据的开放性和公共性。因为完整的、综合的医疗数据不可能是一家医院、一群人、一个行业或社会管理者所能够制造并获得的,大数据必然产生于一个开放的,公共的网络环境之中。

(4)医疗数据的动态性和实时性。医疗数据时刻都在产生,而且不间断,每一时刻产生的医疗数据都在变化。

(5)医疗数据的内在关联性。由于不同采集系统所收集的医疗数据可能指向同一事物或事件,这种相互的关联是由于医疗数据所描述的对象所决定的,每一医疗数据之间存在着天然联系。所以医疗大数据的获取、管理及分析挖掘都不同于传统方法。

3.医疗大数据采集与过滤

(1)医疗数据采集

①医疗物联网采集。物联网由感知层、网络层和应用层构成。数据采集终端设备、保证数据安全接入的AP和网关物联网的感知层;中间件、网络管理软件和信息采集、汇聚、分析和发布软件都属于物联网的网络层;感知层、网络层负责客观环境数据采集和传输,通过多传感器数据管理模块的采集模块把数据解析成统一格式,将传感器关联实体进行匹配后,整合相关信息进行业务处理和数据库数据写入;电子病历、HIS、LIS等医疗物联网的应用划分为医疗物联网的应用层。

终端设备如下。

物联网呼吸监测仪:仪器以低功耗MCU为控制核心,采用压力传感器采集人的呼吸信号。该仪器能有效地提取呼吸信号,并从中得出呼吸暂停的次数。与标准仪器所测的数据作对比发现,本仪器所得的各参数准确度大于98%。基本满足临床上睡眠呼吸暂停综合征患者早期诊断的需求。

物联网健康秤:体重指标也是健康管理的一项重要指标。该秤以低功耗MCU为主控单元,采用压力传感器采集体重信息,经单片机处理后,通过GPRS模块,把数据发送到目标服务器上。测量误差±0.1kg,无人操作自动睡眠待机。

物联网心电测量仪:针对心脏病患者设计的便携式的心电图测量仪,可以为医生研究患者的病情分析和治疗提供参考。由传感器模块、放大电路模块、A/D转换模块、显示模块完成心电信号测量和显示。

采用三级级联放大,能够对微弱的心电信号进行采集、转换成适合A/D转换模块转换的模拟信号,A/D转换模块把模拟信号转换成数字信号并交给单片机,单片机处理数据后经无线模块发送出去。

物联网血压计:家用血压计现在已很常见,该物联网血压计是在其基础上增加了无线联网模块,是将采集的血压数据实时上传到服务器,作为健康指数供医生研究,不正常的血压信号会及时得到医生帮助。

物联网血糖测试仪:血糖参数对某些疾病也是一个重要的参考数据。常用血糖采集有电化学法和光反射法,后者技术比较成熟。检测反应过程中以试条的颜色变化来反映血糖值,通过酶与葡萄糖的反应产生的中间物(带颜色物质),运用检测器检测试纸反射面的反射光的强度,将这些反射光的强度,转化成葡萄糖浓度,再由单片机将有效数据通过物联网络发送出去。

物联网脉率检测仪:仪器以低功耗MCU为控制核心,通过红光和红外光照射人的手指等部位采集脉搏波信号。该仪器能有效地提取脉搏波信号,由单片机做响应时间的脉搏统计得出脉搏参数,并通过无线模块实现数据交换。

一体化设计,采用电池供电,满足移动要求;可测量脉搏、血管、血液、微循环等方面参数,实时显示脉搏参数,也可打印信号图纸;操作简便,可存储多组测量数据,内置电池可连续使用10小时,更适合户外健康检测活动。

②移动互联网数据采集:移动互联网是移动通信和互联网技术的结合,为移动终端提供信息服务的互联网。智能手机、平板电脑都是常用的移动终端,接入终端的链路层可以是2G、3G、4G、WIFI等。终端应用程序统称为APP,目前已开发出能代替温度计、听诊器,能检测脉搏、血压、活动步数、消耗的卡路里和睡眠时间等健康数据的手机APP;能进行心电图检测的手机。开发出基于智能手机的穿戴式移动监测系统,实现心电、呼吸、体温以及体位/体动等多项基本生理参数的低负荷获取。

③其他数据采集:系统日志采集医疗数据,医疗信息系统和卫生信息交换平台都有完备的日志,记录系统运行、数据改变的操作和状态。通过分析日志自动提取医疗数据,其工作流程如下:收集并分析日志格式和语义,不同系统的日志可能有成千上万种可能的格式,同一种系统由于设置不一样,日志格式也不尽相同;编写脚本或软件,自动解析日志数据成标准数据格式;将日志文件导入分布式系统;按相关主题,提取数据存入存储系统。

通过数据库触发器、WEB服务、搜索引擎等采集医疗数据。通过搜索引擎采集医疗数据,首先建立一个网络专题信息的目标样本库,在此基础上,建立一整套用于专题信息特征提取和词频统计的总词典。这些词典要根据医院工作的需要制定,要有不断自动补充新词汇的功能,才能做到系统总词库的自动更新;其次根据目标样本的词频分布,从总词典中提取挖掘目标的特征信息,由系统自动确定信息采集的范围,运用信息过滤技术从网络中获取与事先制定好标准的相关信息;最后提取源信息的特征向量,运用匹配算法和相关模型将获取的网络信息与用户需求模板的特征向量进行匹配,将符合要求的信息提取出来,存入存储系统。

(2)医疗数据整理与隐私保护。医疗数据汇集成大数据后,由于其收集范围广、长时期保存、信息完备性,通过数据关联分析,可以准确定位到个人。因此,个人信息的隐私极易暴露。如何保护隐私是大数据医疗面临的问题之一。

医疗大数据来源多样,积累时间长。存在数据不完整、有重复数据、标准不统一等问题。在使用前需要按应用主题,进行数据整理和过滤,消除不一致的数据、失效数据和无用数据,融合相关信息。

医疗大数据整理有十大目标:①数据有明确和准确的定义;②数据有明确的责任方;③数据内容符合标准要求;④数据内容符合质量要求;⑤数据的成本与价值可计量;⑥数据集中存储与管理;⑦数据有合理的存储期限和方式;⑧数据进行统一的加工和整合;⑨数据是易访问的;⑩数据访问有安全控制。

明确数据的责任方是数据整理的核心,只有建立健全数据认责机制才能稳固数据整理成果,数据标准则为数据认责提供了“权责清晰”的保障。

按数据标准进行整理是保证数据价值和质量的基本要求。数据标准的制定、元数据模型及元数据管理平台的搭建、数据质量的管理以及数据生命周期的管理是数据整理的基础条件。

整理内容主要有:数据清洗、填补、平滑、合并、规格化以及检查一致性等处理,并对数据的多种属性进行初步组织,从而为数据的转储、分析和挖掘做好准备。

4.医疗大数据的应用 大数据概念来源于“商业智能”,它天然地与应用联系在一起。医疗大数据主要在五个方面应用。

(1)临床医疗。基于治疗效果的比较研究。通过全面分析患者特征数据和疗效数据,然后比较多种干预措施的有效性,寻找针对患者个体的最佳治疗途径。

①基于疗效的研究包括比较效果研究(Comparative Effectiveness Research,CER)。研究表明,对同一患者来说,医疗服务提供方不同,医疗护理方法和效果不同,成本上也存在着很大的差异。精准分析包括患者体征数据、费用数据和疗效数据在内的大型数据集,可以帮助医生确定临床上最有效和最具有成本效益的治疗方法。医疗护理系统实现CER,将有可能减少过度治疗(比如避免那些副作用比疗效明显的治疗方式),以及治疗不足。从长远来看,不管是过度治疗还是治疗不足都将给患者身体带来负面影响,以及产生更高的医疗费用。

世界各地的很多医疗机构(如英国的NICE,德国IQWIG,加拿大普通药品检查机构等)已经开始了CER项目并取得了初步成功。2009年,美国通过的复苏与再投资法案,就是向这个方向迈出的第一步。在这一法案下,设立的比较效果研究联邦协调委员会协调整个联邦政府的比较效果的研究,并对4亿美元投入资金进行分配。这一投入想要获得成功,还有大量潜在问题需要解决,比如,临床数据和保险数据的一致性问题,当前在缺少EHR(电子健康档案)标准和互操作性的前提下,大范围仓促部署EHR可能造成不同数据集难以整合。再如,患者隐私问题,想要在保护患者隐私的前提下,又要提供足够详细的数据以便保证分析结果的有效性不是一件容易的事情。还有一些体制问题,比如目前美国法律禁止医疗保险机构和医疗补助服务中心(Centers for Medicare and Medicaid Services)(医疗服务支付方)使用成本/效益比例来制定报销决策,因此即便他们通过大数据分析找到更好的方法也很难落实。

②临床决策支持:临床决策支持系统可以提高工作效率和诊疗质量。大数据分析技术将使临床决策支持系统更智能,这得益于对非结构化数据分析能力的日益加强。比如可以使用图像分析和识别技术,识别医疗影像(如X线、CT、MRI)数据,或者挖掘医疗文献数据建立医疗专家数据库(就像IBM Watson做的那样),从而给医生提出诊疗建议。在美国Metropolitan儿科重症病房的研究中,临床决策支持系统使用两个月就削减了40%的药品不良反应事件。

此外,临床决策支持系统还可以使医疗流程中大部分的工作流流向护理人员和助理医生,使医生从耗时过长的简单咨询工作中解脱出来,从而提高治疗效率。

③医疗数据透明:提高医疗过程数据的透明度,可以使医疗从业者、医疗机构的绩效更透明,间接促进医疗服务质量的提高。

根据医疗服务提供方设置的操作和绩效数据集,可以进行数据分析并创建可视化的流程图和仪表盘,促进信息透明。流程图的目标是识别和分析临床变异的来源,然后优化流程。仅仅发布成本、质量和绩效数据,即使没有与之相应的物质上的奖励,也往往可以促进绩效的提高,使医疗服务机构提供更好的服务,从而更有竞争力。

数据分析可以带来业务流程的精简,通过精益生产降低成本,找到符合需求的工作更高效的员工,从而提高护理质量并给患者带来更好的体验,也给医疗服务机构带来额外的业绩增长潜力。美国医疗保险和医疗补助服务中心正在测试仪表盘,将其作为建设主动、透明、开放、协作型政府的一部分。本着同样的精神,美国疾病控制和预防中心(Centers for Disease Control and Prevention)已经公开发布医疗数据,包括业务数据。

公开发布医疗质量和绩效数据还可以帮助患者做出更明智的健康照护决定,这也将帮助医疗服务提供方提高总体绩效,从而更具竞争力。

④远程患者监控:从对慢性患者的远程监控系统收集数据,并将分析结果反馈给监控设备,查看患者是否正在遵从医嘱,从而确定今后的用药和治疗方案。

2010年,美国有1.5亿慢性病患者,如糖尿病、充血性心脏衰竭、高血压患者,他们的医疗费用占到了医疗卫生系统医疗成本的80%。远程患者监护系统对治疗慢性病患者是非常有用的。远程患者监护系统包括家用心脏监测设备、血糖仪,甚至还包括芯片药片,芯片药片被患者摄入后,实时传送数据到电子病历数据库。举个例子,远程监控可以提醒医生对充血性心脏衰竭患者采取及时治疗措施,防止紧急状况发生,因为充血性心脏衰竭的标志之一是由于保水产生的体重增加现象,这可以通过远程监控实现预防。更多的好处是,通过对远程监控系统产生的数据的分析,可以减少患者住院时间,减少急诊量,实现提高家庭护理比例和门诊医生预约量的目标。

⑤对患者档案的高级分析:在患者档案方面应用高级分析可以确定哪些人是某类疾病的易感人群。举例说,应用高级分析可以帮助识别哪些患者有患糖尿病的高风险,使他们尽早接受预防性保健方案。这些方法也可以帮患者从已经存在的疾病管理方案中找到最好的治疗方案。

(2)付款/定价。对医疗支付方来说,通过大数据分析可以更好地对医疗服务进行定价。以美国为例,这将有潜力创造每年500亿美元的价值,其中一半来源于国家医疗开支的降低。

①自动化系统:自动化系统(例如机器学习技术)检测欺诈行为。业内人士评估,每年有2%~4%的医疗索赔是欺诈性的或不合理的,因此检测索赔欺诈具有巨大的经济意义。通过一个全面的一致的索赔数据库和相应的算法,可以检测索赔准确性,查出欺诈行为。这种欺诈检测可以是追溯性的,也可以是实时的。在实时检测中,自动化系统可以在支付发生前就识别出欺诈,避免重大的损失。

②基于卫生经济学和疗效研究的定价计划:在药品定价方面,制药公司可以参与分担治疗风险,比如基于治疗效果制定定价策略。这对医疗支付方的好处显而易见,有利于控制医疗保健成本支出。对患者来说,好处更加直接。他们能够以合理的价格获得创新的药物,并且这些药物经过基于疗效的研究。而对医药产品公司来说,更好的定价策略也是好处多多。他们可以获得更高的市场准入可能性,也可以通过创新的定价方案,更有针对性疗效药品的推出,获得更高的收入。

在欧洲,现在有一些基于卫生经济学和疗效的药品定价试点项目。

一些医疗支付方正在利用数据分析衡量医疗服务提供方的服务,并依据服务水平进行定价。医疗服务支付方可以基于医疗效果进行支付,他们可以与医疗服务提供方进行谈判,看医疗服务提供方提供的服务是否达到特定的基准。

(3)科学研究。利用大数据能够提高科学研究的水平和效率。以美国为例,每年创造超过1000亿美元的价值。

①预测建模:医药公司在新药物的研发阶段,可以通过数据建模和分析,确定最有效率的投入产出比,从而配备最佳资源组合。模型基于药物临床试验阶段之前的数据集及早期临床阶段的数据集,尽可能及时地预测临床结果。评价因素包括产品的安全性、有效性、潜在的副作用和整体的试验结果。通过预测建模可以降低医药产品公司的研发成本,在通过数据建模和分析预测药物临床结果后,可以暂缓研究次优的药物,或者停止在次优药物上的昂贵的临床试验。

除了研发成本,医药公司还可以更快地得到回报。通过数据建模和分析,医药公司可以将药物更快推向市场,生产更有针对性的药物,有更高潜在市场回报和治疗成功率的药物。原来一般新药从研发到推向市场的时间大约为13年,使用预测模型可以帮助医药企业提早3~5年将新药推向市场。

②提高临床试验设计的统计工具和算法:使用统计工具和算法,可以提高临床试验设计水平,并在临床试验阶段更容易地招募到患者。通过挖掘患者数据,评估招募患者是否符合试验条件,从而加快临床试验进程,提出更有效的临床试验设计建议,并能找出最合适的临床试验基地。比如那些拥有大量潜在符合条件的临床试验患者的试验基地可能是更理想的,或者在试验患者群体的规模和特征二者之间找到平衡。

③临床实验数据的分析:分析临床试验数据和患者记录可以确定药品更多的适应证和发现副作用。在对临床试验数据和患者记录进行分析后,可以对药物进行重新定位,或者实现针对其他适应证的营销。实时或者近乎实时地收集不良反应报告可以促进药物警戒(药物警戒是上市药品的安全保障体系,对药物不良反应进行监测、评价和预防)。或者在一些情况下,临床实验暗示出了一些情况但没有足够的统计数据去证明,现在基于临床试验大数据的分析可以给出证据。

④个性化治疗:另一种在研发领域有前途的大数据创新,是通过对大型数据集(例如基因组数据)的分析发展个性化治疗。这一应用考察遗传变异、对特定疾病的易感性和对特殊药物的反应的关系,然后在药物研发和用药过程中考虑个人的遗传变异因素。

个性化医学可以改善医疗保健效果,比如在患者发生疾病症状前,就提供早期的检测和诊断。很多情况下,患者用同样的诊疗方案但是疗效却不一样,部分原因是遗传变异。针对不同的患者采取不同的诊疗方案,或者根据患者的实际情况调整药物剂量,可以减少副作用。

个性化医疗目前还处在初期阶段。在某些案例中,通过减少处方药量可以减少30%~70%的医疗成本。比如,早期发现和治疗可以显著降低肺癌给卫生系统造成的负担,因为早期的手术费用是后期治疗费用的一半。

⑤疾病模式的分析:通过分析疾病的模式和趋势,可以帮助医疗产品企业制定战略性的研发投资决策,帮助其优化研发重点,优化配备资源。

(4)新的商业模式。大数据分析可以给医疗服务行业带来新的商业模式。

①汇总患者的临床记录和医疗保险数据集:汇总患者的临床记录和医疗保险数据集,并进行高级分析,将提高医疗支付方、医疗服务提供方和医药企业的决策能力。比如,对医药企业来说,他们不仅可以生产出具有更佳疗效的药品,而且能保证药品适销对路。临床记录和医疗保险数据集的市场刚刚开始发展,扩张的速度将取决于医疗保健行业完成EMR和循证医学发展的速度。

②网络平台和社区:另一个潜在的大数据启动的商业模型是网络平台和大数据,这些平台已经产生了大量有价值的数据。比如PatientsLikeMe.com网站,患者可以在这个网站上分享治疗经验;Sermo.com网站,医生可以在这个网站上分享医疗见解;Participatorymedicine.org网站,这家非营利性组织运营的网站鼓励患者积极进行治疗。这些平台可以成为宝贵的数据来源。例如,Sermo.com向医药公司收费,允许他们访问会员信息和网上互动信息。

(5)公众健康。大数据的使用可以改善公众健康监控。公共卫生部门可以通过覆盖全国的患者电子病历数据库,快速检测传染病,进行全面的疫情监测,并通过集成疾病监测和响应程序,快速进行响应。这将带来很多好处,包括医疗索赔支出减少、传染病感染率降低,卫生部门可以更快地检测出新的传染病和疫情。通过提供准确和及时的公众健康咨询,将会大幅提高公众健康风险意识,同时也将降低传染病感染风险。所有的这些都将帮助人们创造更好的生活。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈