•   2024年7月

基于“全病一库”模式的统一科研大数据平台

前言:

随着医学科学的发展,精准医学和临床亚专业逐渐兴起,疾病研究越来越深入,临床研究更加依赖某一类甚至某一种疾病的病例数据。我国《关于公立医院高质量发展的指导意见》明确了“三转变、三提高”的核心,其核心内涵就是要加强学科建设和科学管理。近日,国家体制改革司《生化医药卫生体制改革2024年重点工作任务》中明确提高临床科研和成果转换,是推动公立医院高质量发展的重要任务之一。

(一)传统主流回顾性科研专病专库的局限和制约

临床研究的开展需要全面、准确且大量的数据进行支撑。在实际临床科研开展过程中,会面临由于信息系统建设时间和需求的差异,导致数据底层标准不同,造成数据的采集和汇聚难题。即便完成了多源临床数据的采集与整合,传统回顾性科研专病库的建设依旧存在多重制约。

从科研数据建设逻辑来讲,回顾性的专病专库的模式所建成的专病库之间难以实现数据共享和复用,等同于“一次性”的数据建设与应用,随着医院科研的发展,专病库将会陷入重复建设的轮回。

从技术层面讲,传统数据库存在性能不足,无法支撑专病库极速扩容,也无法满足短时间对大量复杂数据进行分析处理的需求。

从科研数据本身来讲,格式多样、缺乏标准规范、数据质量差的历史源数据无法直接支撑科研,而复杂的数据处理即便耗费了大量的人力、财力和物力,却利用率、转化率等最终的价值成效提升方面极为有限,这是因为源数据本身是缺乏科研意识的。

总体而言,回顾性的科研虽然能够更加具有针对性的开展专病研究,但是其高昂的成本投入、难以掌控的时间周期和不可保障的科研结果已经难以满足高质量发展下医院对高效精准的临床科研开展和成果转换的需求。

(二)天助科研大数据平台的特点:统一性、前瞻性、智慧性

天助遵循顶层设计原则,以医院临床科研需求为核心,以建设“全病一库”模式的科研大数据平台为创新,打造了既支持前瞻性也支持回顾性科研的“全院自主科研大数据平台”。旨在打破回顾性科研在逆向数据处理和传统数据库性能不足方面受到的制约,同时颠覆单一的回顾性科研逻辑,实现从专病专库到全病一库、从回顾性到兼顾前瞻性和回顾性的转变,结合AI和建模工具等创新技术的应用,为临床科研提供最简化、更智能的支持工具。

(1)主要实现路径

全面应用服务提升:通过完善建设和调度随访平台、患者管理、生物样本库、影像标注平台、全结构化平台、外挂科研服务平台等来完善数据源,确保科研数据的完整性。在这些业务当中埋下数据探针,当患者符合科研队列要求时,可自动捕获相关患者数据,并推荐给科研医生。实现按需式、干预式收集的前瞻性科研数据收集。

数据标准化处理:将数据的基础表进行标准化定义前置,并固化数据流程,打造数据生产、流转皆为标准化状态。

全院数据采集、汇聚与分中心数据衍生:底层采用内存数据库技术,利用内存数据库强大的数据集成能力,将分散在HIS、LIS、电子病历等各个系统中的数据进行统一1:1采集,且结合CRF表单的应用,将源头数据结构化,完善科研数据,包括医院的生物样本库数据也在采集范围。

将获取到的数据,汇聚成多类科研基础表,确保了数据的一致性。再根据不同的科研中心对数据指标的需求,进行数据的2/3级衍生。

科研数据的应用:天助全院自主科研大数据平台针对不同的角色提供不同数据的开放和使用权限。对信息科提供资源使用监管;对专病分中心,提供数据模块化服务;对临床医生,提供科研数据服务。

(2)建设优势及成效

统一性:基于内存数据库的强大集成能力和大数据级性能,实现对全院数据的统一采集,并按照各类科研表和面面向不同专病分中心的2/3级表进行统一存储。实现统一的资源管理、统一的数据规范标准及统一的科研服务提供。这是一个从分散到统一,再到资源衍生和自主管理的过程。

前瞻性:在应用服务补充完善的前提下,在实现多源数据整合的基础上,还能够基于完整的数据来源,实现队列对象的前瞻性推荐和数据捕获,以科研视角和思维按需获取的数据,更加符合科研所需,也能支撑科研输出更加精确的结果。

智能性:在数据的获取方面,结构化的CRF表单支撑数据提取,逆向生成电子病历,让一次数据获取既满足科研需求也能满足电子病历需求,减少人工录入工作量,提高数据的质量和可用性价值。

除了结构化CRF表单的使用外,系统实现完成了科研建模(CUBE),大大简化了数据挖掘的难度。医生通过运用模型,能够在无IT支撑的情况下,对表单数据执行无代码的拖拽,即可完成科研纳排。还结合了AI对自然语言的处理能力和RAG模型,加强科研数据服务的智能化调度。让科研的数据响应匹配上科研的思维和速度,按需、即席且同步的进行。

成果展望:天助通过建立统一的科研大数据平台,有效解决数据孤岛问题,并按照科研对数据的共性需求,先对数据进行面向专病分中心的数据衍生和建模(CUBE)处理,形成既有原料也有“预制菜”的超级科研数据集市,这不仅强化了科研的深度和范围,更在便捷、高效、精准的应用下,实现科研数据的共享和长期建设发展。与AI的进一步融合是天助全院自主科研大数据平台在应用上的又一创新点,通过对AI智能语言处理技术和ARG检索增强生成模型的融合,更是为科研人员高效且智能的科研数据检索和分析挖掘体验,最大程度简化科研操作,提高科研效率,优化科研质量。