当前位置:网站首页 > 探索 > 【探索】大数据背景下医院数据资源分类框架与数据标准化分析

【探索】大数据背景下医院数据资源分类框架与数据标准化分析

【探索】大数据背景下医院数据资源分类框架与数据标准化分析大数据背景下医院数据资源分类框架与数据标准化分析

DOI:10.3760/cma.j.cn111325-20231017-00227

摘 要

医院数据资源是医院的重要资产之一,将分散在不同信息系统的数据进行整合归类和标准化处理,能满足大数据背景下急剧增加的多样化数据应用需求。医院数据资源发展历程经历了从纸质记录到信息化数据收集阶段,再到操作型数据仓储和数据应用阶段,对医学发展起到十分重要的作用。近年来,一些发达国家通过明确数据应用目标,建立了数据资源分类框架体系,对医院数据资源实施统一分类管理和数据标准化处理,在辅助临床决策、推动科学研究和实施精细化医院管理等方面取得良好应用成效,如英国医院病例统计、澳大利亚国家卫生信息模型、美国医疗服务效果数据及信息收集系统及医疗保健成本和利用项目。目前,我国发布了一系列卫生信息相关政策文件和规范标准,加大对医院信息化建设的支持力度,推动了数据分类管理和标准化建设。但是,我国尚未建立健全统一的医院数据资源分类管理体系,且存在数据异构化问题,影响了医院数据资源的充分应用。本研究建议,可借鉴国际经验,立足数据应用需求,建立统一的医院数据资源分类框架体系;基于数据集标准,推动医院数据标准化建设,提高数据应用效率,促进数据价值释放。

前 言

信息技术高速发展推动了大数据时代的到来,有效管理和应用数据资源是实现大数据价值的关键所在[1-2]。近年来,一些发达国家将开发利用大数据作为新一轮产业竞争制高点的抓手[3];我国将于2023年10月成立国家数据局,以推动大数据产业发展应用[4]。医院数据资源因规模大、种类多、增长迅速和价值高,已成为医院的重要资产之一,备受业界关注[5-6]。目前,医院数据激增与低价值密度应用之间的矛盾日益突出[7],亟须整合、归类和标准化处理分散在各个信息系统中的数据,以满足日益增加的多样化数据应用需求。数据分类框架体系可将不同数据定位在相应的层级结构中,是规范管理和高效利用数据资源的重要手段[8]。本研究立足于医院数据应用需求的紧迫性,通过梳理医院数据资源发展历程,总结国外医院数据资源分类框架体系建设经验,分析我国医院数据资源分类管理现状及存在问题,并提出建议,为推动我国医院数据资源的规范化管理和应用提供参考。

一、医院数据资源的发展历程

医院数据资源是基于患者诊疗全过程产生、收集和存储的数字信息和记录的集合,涵盖了疾病诊疗、健康监测、医学研究和医院管理等方面的数据[6,9],在医学知识积累中发挥了至关重要的作用[10]。医院数据资源发展历程经历了从纸质记录到信息化数据收集阶段,再到操作型数据仓储阶段,目前已进入数据应用阶段。

1928年,美国健康信息管理协会提出对医疗信息进行标准化记录,并在全国范围内得到快速推广应用,此后越来越多的国家在医院内部使用标准统一的医疗记录方式,医院数据资源初步形成[11]。自20世纪60年代以来,随着电子健康档案和医院信息系统的普及,纸质医疗记录逐渐被电子化和数字化记录取代,为医疗服务领域带来多方位的信息支持,实现了患者信息的快速访问和数据共享,简化了临床工作流程,推动了医学研究和循证实践的发展,医院数据资源呈现快速增长趋势[12]。近年来,互联网的高速发展、云计算技术的日益成熟以及物联网和移动终端的广泛普及,共同促成了海量医院数据的生成,为医疗领域带来前所未有的数据资源。目前,医院数据资源不仅包括以表格和数据库形式存储的结构化数据,还包括医疗影像和基因组学信息等非结构化数据[6],体现出多源异构的复杂特性。医院数据资源已经从诊疗信息记录保存工具演变为临床决策、医院管理、医学研究和医疗资源规划的重要依据[13-14]。

二、国外医院数据资源分类框架与数据标准化管理

近年来,一些发达国家深刻认识到医院数据资源在医疗管理和规划中的重要价值,纷纷建立医院数据资源分类框架体系,为医院提供了清晰的数据管理手段和标准。其中,英国医院病例统计(hospital episode statistics,HES)侧重病例数据的收集和分析,澳大利亚国家卫生信息模型(national health information model,NHIM)涵盖了广泛的健康信息领域,美国医疗服务效果数据及信息收集系统(healthcare effectiveness data and information set,HEDIS)及医疗保健成本和利用项目(healthcare cost and utilization project,HCUP)强调借助医院数据实现医疗服务绩效和成本利用评估。这些医院数据分类框架体系通过持续更新和完善,不断满足临床诊疗、管理决策和科学研究等方面的应用需求,推动了医院数据元素、格式、编码和协议的标准化,确保了数据的可靠性和可比性,可为其他国家的医院进行数据分类管理提供借鉴,见表1。

探索性数据分析名词解释_探索性数据分析方法有哪些_探索性数据分析

(一)英国:1987年,HES由英国国家卫生服务体系(national health service,NHS)创建和管理[15]。该体系是面向全国的医院数据分类框架,通过标准化收集数据,为制定相关科学决策、实现医疗资源有效分配、改进医疗质量、提高医疗服务效率和满足患者需求提供可靠的数据支撑[16]。目前,HES已成为英国医院信息的核心存储库,被广泛应用于临床诊疗、医学研究和医疗规划等方面[17],促进了医疗数据的交流和共享,提高了医院的绩效评估和医疗质量研究的准确性[18]。

HES按照住院病例、门诊病例、急诊病例和重症监护病例4类主题对医院数据进行归类[16],每类主题均涵盖临床诊疗信息(包括诊断、治疗和手术等信息)、人口学信息(包括年龄、性别、NHS编号和居住地等信息)、医院运营管理信息,以及患者和服务提供者的标识信息。

在数据标准化方面,HES采用了统一的调试数据集标准[19],具体做法包括使用标准化数据收集表格,要求医院按照统一的结构化数据标准输入数据元素;明确医院必须上报的数据元,确保收集数据类型的一致性;遵循国际通用的标准编码体系,如临床诊断和治疗信息使用国际疾病分类第十次修订本(international classification of disease-10,ICD-10)以及人口普查和手术程序分类(office of population censuses and surveys classification of surgical operations and procedures,OPCS-4);应用严格的数据验证和质量保证流程,对数据的完整性、准确性和一致性进行检查,确保所有数据符合预定义要求。

(二)澳大利亚:为解决医疗卫生数据面临定义不统一、质量参差不齐和获取障碍等问题[20],1995年,澳大利亚卫生部发布了NHIM,对医疗数据进行统一管理和分类,为医疗卫生信息的组织、存储、表达和应用提供结构性数据支撑。NHIM适用于包括医院在内的所有卫生机构的数据规范化管理,实现了全国范围内卫生信息的一致性、可比性和互操作性,有益于改善医院医疗服务质量,推动科学研究发展和完善相关政策制定。

针对医院数据,NHIM以医疗活动过程中的参与者为核心,对数据进行分类,该分类框架包含6类主题[21]。一是参与者角色,包括患者、医生、政府、社会组织和公司等信息数据;二是参与者特征,包括人口统计学信息和社会经济因素等数据;三是事件,指与医院临床诊疗、行政管理和科学研究等事件的相关数据;四是业务因素,指与医院业务相关的数据,包括业务内容、业务程序和业务协定;五是支持因素,指提供医疗服务所需的资源和支持数据,如人力资源、财务资源、物资资源和信息资源等;六是环境因素,指影响健康结果的外部因素,如地理位置和空气质量等相关数据。

NHIM对医疗健康信息的收集、存储和交换采用统一标准,通过参考国家数据字典,为不同信息元素提供详细定义和元数据标准;使用标准化医学词汇和编码系统,如临床术语系统化命名与编码(systematized nomenclature of medicine-clinical terms,SNOMED CT)和ICD-10(澳大利亚修改版),以确保相关概念表达方式的一致性;采用“卫生信息用户层交换协议”和“快速医疗互操作性资源”等数据交换标准,保障不同医疗系统之间数据交换与互操作[21]。

(三)美国:

1.HEDIS:20世纪末,随着医疗成本的不断上升和托管医疗计划的扩展,美国政府迫切需要建立统一的标准化方法评估和改进医疗质量,合理控制医疗成本[22]。1991年,美国国家质量保证委员会建立了HEDIS,通过实行统一的医疗服务质量评估指标体系,标准化整合与归类全国医院数据,评估医院医疗服务流程和患者就医体验等,持续改进以患者为中心的医疗服务质量[23]。

HEDIS评估范围涵盖6类主题(90个指标)[24],一是医疗服务效果(53个指标),评估预防保健、慢性病管理和临床治疗等医疗服务效果和质量;二是医疗服务可及性和可用性(5个指标),评估患者是否能及时获得必要的医疗服务;三是医疗服务满意度(4个指标),衡量患者就医体验,评估患者满意度和医患沟通指标;四是医疗服务和资源使用(9个指标),评估医疗服务提供和医疗资源配置之间的匹配水平;五是健康计划(3个指标),评估健康计划的背景、结构和运营方式;六是临床治疗措施(16个指标),获取患者临床治疗和结果的实时信息,评估医疗服务质量。

HEDIS基于数据集进行数据标准化处理,主要做法包括定义每个指标的数据元和数据收集方式;明确数据特定来源,包括电子健康档案、医保数据和药房数据等;采用数据验证和审计流程,维护数据质量和准确性,实现医疗质量和绩效数据的标准化,方便医院、政策制定者和患者进行医疗质量的比较和评估。

2.HCUP:在HCUP创建之前,美国的医院医疗业务数据分散在不同的医疗组织和机构中。为满足医疗质量改进工作和科学研究等方面的数据应用需求,1988年,美国医疗保健研究和质量局资助建立了HCUP,旨在推动科学研究发展、辅助政策制定以及提升医疗服务水平[25]。目前,HCUP已成为美国最大的纵向医院诊疗数据收集项目[26],可为其他国家和地区在医疗领域增强数据驱动的决策支持提供借鉴。

HCUP将医院数据分为5类主题[26],一是住院患者信息,是可公开使用的住院患者数据集,用于分析住院服务利用、费用、质量和结果的发展趋势;二是儿科住院患者信息,是可公开使用的全付费儿科住院诊疗数据集,用于分析儿科住院情况,尤其是罕见疾病和特殊治疗的分析;三是门诊手术患者信息,是全付费门诊手术数据集,用于分析门诊手术数量、费用和质量等;四是急诊患者信息,是急诊科治疗或经急诊入院的患者数据集,用于分析急诊患者就诊情况和费用等;五是再入院和院内死亡患者信息,指出院后1年内再入院患者和院内死亡患者的诊疗数据集,用于分析患者再入院和院内死亡情况。

HCUP关联了不同来源的医疗数据,通过统一定义数据元和数据标准,采用标准编码规范,如ICD-10、SNOMED CT和医疗服务共同编码等,以及使用医疗数据报告的常见数据格式,实现了医院数据的标准化收集和集中存储[27]。

三、我国医院数据资源分类管理现状和存在问题

(一)现状:20世纪90年代中期,我国医院信息化建设迎来了快速发展阶段,医院信息系统、图像存储与通信系统等项目的开发和应用,推动了数据和医疗的融合,产生了海量数据[12]。近年来,随着数字技术在医院的普及,医院数据资源规模呈指数级增长。在大数据时代背景下,我国医院数据资源已经发展到操作型数据仓储和数据应用阶段。

为了加强健康医疗大数据创新应用和行业治理,充分释放数据价值,新医改以来,我国发布了一系列卫生信息相关政策文件,包括《卫生事业发展“十二五”规划》(国发〔2012〕57号)和《关于促进和规范健康医疗大数据应用发展的指导意见》(国办发〔2016〕47号)等[28-32],这些政策的落实推动着我国进入人口健康信息化建设阶段,加速了医院数据集成和标准化建设进程,为我国医院信息化建设指明了发展方向。同时,我国制定了卫生信息数据管理相关规范和标准(表2),为医院数据分类管理和数据标准化建设提供指导。例如,《国家卫生信息资源分类与编码管理规范》(WS/T 787-2021)规定了卫生信息资源目录管理架构、目录编制流程,以及卫生信息资源标识符编码规则等,将医院医疗服务信息分为临床服务、医疗管理和运营管理3类,涵盖了35个条目[33];《全国医院信息化建设标准与规范(试行)》,从软硬件建设、安全保障、新兴技术应用等方面规范了医院信息化建设的主要内容和要求,对医院数据规范化管理具有重要的指导意义[32]。另外,近年来,各地政府加大了对医院信息化建设的财政支持力度,鼓励医院探索应用先进的信息技术管理和利用数据资源,引导医院积极参与数据标准的制定和修订工作,确保国家要求与医院实际数据管理需求相一致。

探索性数据分析方法有哪些_探索性数据分析_探索性数据分析名词解释

目前,我国越来越多的医院重视数据标准化采集和管理工作。一些医院通过建立医院数据仓库和数据分析中心,实现了医疗活动全周期数据的标准化收集和管理[34];通过引入先进数字技术,加强对相关管理人员和技术人员的专业培训,提高医院数据管理水平[35],推动了数据资源的挖掘应用及数据价值的释放。

(二)存在问题:虽然,国家层面出台的相关政策文件和规范标准为医院数据资源管理提供了支持和指导,但我国医院数据资源整体缺少统一的统筹管理机制,且不同来源数据的异构化问题严峻。

1.医院数据资源分类框架体系有待建立健全。大数据应用的前提是明确数据资源的类别及其内容,以便有针对性地收集和分析数据。目前,我国尚未建立健全统一的医院数据资源分类框架体系[36],不利于医院数据的深度挖掘和应用,限制了大数据价值的释放。其原因可能是,不同医院甚至同一医院内部的信息系统存在多样性和复杂性的问题,且系统开发厂商众多,加大了数据分类收集的难度,制约了医院数据资源的横向互联、互通和共享;另外,由于医院数据资源分类管理与数据应用需求之间缺少有机衔接的统筹规划机制,导致医务人员、科研人员和管理者通常要花费大量的时间和精力整理和归纳数据,进一步降低了数据资源利用效率[37]。

2.医院数据资源标准化建设亟待提高。随着医院数据的规模和复杂性不断增加,数据标准化在大数据领域的重要性将会更加明显。目前,我国卫生健康行政部门和相关学协会已经制定了针对电子病历、医疗服务、运营管理、医院质量安全和药事管理等方面的数据集标准(表2),但是在实际执行过程中,存在执行不到位和标准不统一问题[36]。不同医院的数据存储格式存在差异,且数据质量参差不齐,给数据的有效集成、汇总、分析和应用带来挑战[38]。在临床决策方面,医生需同时综合多种数据信息做出临床决策,但由于数据异构化,使其难以快速获取患者所有诊疗信息,影响了临床决策效率[37];在科学研究方面,数据异构化加大了数据获取和整合难度,影响了医学研究的深入发展[14];在医院管理方面,管理者需基于医院数据资源掌握医疗质量和医院运营管理等方面的指标数据,然而数据异构化不利于管理者识别相关发展趋势和改进领域,降低了医院管理决策和资源分配效率[39]。

四、建议

构建统一的医院数据资源分类框架体系和开展数据标准化建设,能有效整合医院大数据资源,实现数据资源的互联互通,释放数据价值,助力健康医疗产业的可持续发展。我国医院大数据资源规范化建设起步较晚,存在诸多有待改进之处,本研究通过借鉴英国和澳大利亚等发达国家的做法,提出以下建议。

(一)立足数据应用需求,建立统一的医院数据资源分类框架体系。国家层面应建立数据资源与其应用需求之间的有效衔接机制,充分调研医院数据应用需求,明确医院数据资源分类框架体系建设目标,以确保该体系建设与我国医院发展战略和业务需求相契合;应用人工智能和机器学习等先进的技术和理念,建立统一的医院大数据资源分类框架体系,实现海量数据的快速和精准归类,助力医务人员、科研人员和管理者发掘数据规律,及时调整诊疗、科研或管理方向,提高数据应用效率[15]。

(二)基于数据集标准,推动医院数据标准化建设。在统一的医院数据资源分类框架指导下,各级医院应以国家层面发布的相关数据集标准为基准,全面规范医院数据的标准化建设,实现医院数据的高效应用。国家层面可针对各类医疗健康数据制定统一的编码规范、元数据规范、数据元属性和索引、术语规范和数据交换标准等,鼓励医院对不同信息系统中的异构数据进行标准化处理[40],对标准化数据资源进行分类汇总和存储。另外,医院在推进数据标准化建设过程中,若发现部分数据资源尚无对应的数据集标准,则应积极反馈给相关卫生健康管理部门。

综上,在全国范围内推行统一的医院数据资源分类框架和数据标准,能有效解决目前医院数据异构化问题,消除数据孤岛,实现医院数据的一致性和可操作性,确保医院数据资源得到充分应用。同时,随着数据应用需求的不断变化和医院数据资源的日益增多,相关卫生健康管理部门应建立相应的持续改进机制,不断完善医院数据资源分类框架和数据标准。

利益冲突 所有作者均声明不存在利益冲突

作者贡献声明吴琼:研究设计、论文撰写;刘月辉:参与研究设计、论文审阅;刘建超、王文青:论文审阅;刘丽华:研究指导、论文修改

参考文献(略)

亲爱的读者:

若您新收到的纸质杂志有破损等情况,请在微信公众号中发送破损杂志照片+您的邮寄信息后,拨打电话010-65257767或85113642,联系编辑部调换。

探索性数据分析_探索性数据分析名词解释_探索性数据分析方法有哪些

上一篇: 【统计知识】万字长文——数据分析深度理解,全是方法论及经验,不看真的就亏了!
下一篇: 《晶核》诞生记:VI-Games和虚幻引擎的“双向奔赴”

为您推荐

发表评论