预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

医疗大数据平台研究及应用 1项目简介 2021年2月19日,通过了《关于推动公立医院高质量发展的意见》, 提出以改革创新为动力,推动公立医院高质量发展。 据此,北京协和医院将智慧科研的建设作为创新切入点,通过全系统 数据整合,完善临床信息系统标准化建设,不断探索科研模式创新、 构建智慧科研新生态,建设了多层次、多领域覆盖的全院级综合性医 疗大数据平台,以及以专科为核心的专病数据库平台等。 2建设与开发 根据建设目标及要求,我院搭建了从数据到应用的多层架构体系,其 中包括:标准体系、多模态数据体系、多模态数据融合与处理、科技 创新应用等。 标准体系 知识库标准的建设,为建设全生命周期的临床数据标准化应用体系、 提高数据利用水平和信息系统智能化程度打下基础。 多模态数据融合与处理 结合机器学习、NLP等大数据技术,整合院内外及公共卫生等多模态 数据,实现了数据融合与处理、数据标化与治理、数据质量质控等一 系列数据的深度治理,为科研数据的使用提供保障。 3.便捷数据查询服务 构建数据服务开放平台,实现数据资产查询与统一调用,同时启动数 据授权与审批机制,保障数据调用的安全。 4.一站式统计分析服务 基于数据的使用分析,匹配相关应用场景,开展临床研究、精准医疗 等内容建设,推动科研应用。 5.研究成果转化“基地” 模型的临床落地应用,加速实现成果转化。 3关键技术 标准体系建设 从临床数据标准化和临床系统数据处理的实际应用场景出发,提出以 实时采集、标准化、可利用、可更新为主要原则的标准化体系建设, 构建覆盖医疗机构标准实施、应用、更新的临床数据标准化应用体系。 2.多模态数据融合与治理 基于大数据及人工智能技术,对院内外数据进行抽取,形成科研数据 中心,从数据库层面打通各信息化应用之间的数据通道,同时对数据 进行加工处理,形成可识别、可利用的数据信息,助力临床研究发展。 (1)数据抽取 对病历、检验、检查、医嘱、护理等数据进行历史数据抽取和增量抽 取。抽取数据过程中,支持不同数据源、各种接口、抽取历史数据和 增量数据、字段映射、字段过滤、条件过滤、工作闲时抽取数据等。 以最短的时 间抽取数据。 ()数据融合与处理 1)EMPI患者主索引 平台支持患者匹配功能,支持基于患者主索引的患者唯一性匹配功能 (依赖于患者主索引系统)、就诊信息整合功能,以及按照患者就诊 类型、时间展示就诊时序的功能和按照就诊时序进行患者数据归集的 功能。 2)多模态数据间关联关系 通过数据间的关系按照门诊、急诊、住院等就诊次数据融合,同时分 析医院就诊电子化数据缺失和无法关联情况,确定处理方案。可通过 科室、日期选择器,对当前患者的历次就诊信息(基本信息、医嘱、 检查报告、检验报告、病历文书、手术记录、护理信息等模块)进行 数据分类选择、融合选择,并进行后期的融合处理。 3)自然语言处理 利用机器学习结合数据模型 实现对自由文本病历、检查报告、护理记录等全量数据的后结构化处 理。从医疗文献、医学指南和医院临床病历中发掘隐含的医学知识, 将自然语言文本数据转化为临床知识,便于原有业务系统的自然语言 文本数据应用到新的临床诊疗与研究。 )OCR识别 系统将OCR识别后的非结构化病历文本库和病案首页系统中的首页 数据进行采集,应用自然语言处理技术,构建初步结构化与标准化的 通用项目数据库;采用病历对照人工与自动核查并行的方式,保证通 用项目数据质量,为科研提供数据支撑。 (3)数据标化与治理 1)数据标准化处理 针对结构化数据,如首页诊断、首页手术、检验、医嘱、费用、入转 出记录、人口学信息等数据,实现与标准化编码的整合及映射,保证 各专科底层数据标准统一,方便后期进行统计分析及科研利用。 操作之后,形成后结构化数据,实现自然语言的计算机可识别、可计 算、可分析。建立真实世界疾病领域模型,助力临床研究。 )数据一致性 对于不规范的数据,通过标准化数据预处理将其转换为标准化数据存 储,基于大数据分析技术,对于数据出现错误的情况,根据既往病历 的数据基础进行纠正。 3)数据残缺治理 对识别出的缺失数据,根据语义和上下文的数据关联进行智能填补完 整。 4)可量化计算 主要分两种形式:一是将分类型的数据自动量化,数据类型包括海量 枚举、少量枚举和二值型,自动转化成可用于统计分析的数值类型; 二是根据提供的值域量化表,将变量量化成表中对应的值,完成量化。