论文部分内容阅读
队列研究是一种研究复杂性疾病病因的重要方法。由于队列研究需要对患者进行长期随访监测,并对暴露资料和结局事件等大量数据进行采集、管理和分析,所以专门服务于队列研究的信息系统应运而生。传统的队列研究信息系统基本是针对特定的队列研究目的定制开发,但由于针对不同疾病、不同目的的队列研究在数据采集和管理上具有共通性,导致了大量的重复劳动。为了解决以上问题,本论文设计并开发了可配置的队列研究信息系统,实现了队列数据采集、数据存储和数据分析的可配置。本论文的内容包括:1)首先调研了队列研究的设计过程,然后分析了队列研究信息系统在队列研究中的作用。在此基础上,调研并分析了队列研究信息系统的研究现状和功能特点。根据分析结果,传统的队列研究信息系统虽然具有类似的数据采集、管理和分析方法,但由于系统大多采用定制开发的方法,无法在多个队列研究间复用,导致了开发力量的浪费,针对该问题本论文提出了一种可配置的队列研究信息系统的解决方案。2)针对不同队列研究在暴露资料和结局事件等数据采集的内容上存在差别的特点,本论文利用国际上openEHR两层建模方法研究了可配置数据采集技术:根据openEHR参考模型定义的数据类型构造不同类型的表单构件,实现了数据采集表单的基本框架;设计了可视化表单设计器,可实现"所见即所得"的表单样式动态调整;将数据项动态绑定到表单构件实例上,可实现表单数据存储和查询的按需调整。3)为了实现可配置数据分析,通过ETL(Extract-Transform-Load)将不同数据源的数据转换成通用数据模型(OMOP Common Data Model,CDM)表达的通用格式。然而由于ETL的过程比较复杂,实现难度较大,提出了原型数据映射到CDM的改进方案。4)设计并实现了可配置的队列研究信息系统,系统主要分为队列建立和队列分析两个模块。队列建立包括数据采集、随访管理和数据管理;队列分析包括CDM格式标准化以及基于CDM利用OHDSI提供的开源软件工具和分析方法库进行队列研究数据分析。5)为了验证研究成果的有效性,本论文将系统在肾病队列研究案例上进行了应用实践,实践证明该系统可以快速、容易地配置一个肾病队列研究信息系统,能够满足肾病队列研究的需求,减少大量重复劳动。