生物医学大数据管理

生物医学大数据管理

我们精心打造了一套高效的生物医学大数据管理体系和资源平台,可整合不同来源和类型的临床、科研、组学等多源异质性数据,通过开发标准化和结构化的数据库和在线数据可视化和数据分析平台,致力于帮助客户最大化其临床和科研数据的价值,并提升数据的安全性。

我们的团队拥有丰富的生物医学大数据管理经验,曾经和正在参加多项国家/国际级大数据项目,包括国家人口健康平台数据资源建设、科技部精准医学计划、人类尿蛋白质组计划等重大课题。

数据管理全流程

数据分析

重复利用

开放共享

数据采集

  • 数据录入
  • 多中心汇交
  • 公共数据整合

数据标准化

  • 数据标准化
  • 语义标准化
  • 文本信息结构化

数据库开发

  • 数据库设计
  • 数据清洗入库
  • 存储/备份

网站功能

  • 数据可视化
  • 在线数据分析
  • 访问权限管理

优势和必要性

应用场景

临床/流调队列研究

通过临床/流调队列的数据采集和管理工具,提高数据采集的便利性和标准化程度,解决多中心数据采集的异质性问题;基于大语言模型对电子病历进行结构化和标准化信息提取

样本信息管理

通过建立样本信息数据库,实施动态管理样本采集、保存、运输、处理全流程的数据,以及样本对应的患者个人信息和临床表型数据,确保样本信息的可靠性和可溯源性

多组学数据库

通过符合国际规范/最小信息准则的元数据收集和描述体系,系统化标准化保存样本和实验信息,支撑组学数据的再分析利用;建立不同组学数据集之间的关联关系,为数据整合分析提供基础

疾病专题门户网站

整合特定疾病领域的临床与组学数据集以及相关的知识库资源,集成数据检索、可视化展示和在线数据分析工具,促进领域研究成果的开放共享和再利用

技术特色:本体与数据元素支撑的数据标准化体系

  • 本体是事物本质概念化的详细说明,其核心作用在于用人和计算机都可以理解的方式描述某一领域内的实体(entity)的定义以及实体之间的相互关系,为概念建立权威且统一的语义表示形式。
  • 数据元素(Data Element)是最小的不可再分的数据单元,它用一组属性描述其定义、标识、表示和允许值。数据元素着重于数据的值域、计量单位等特性的标准化表示。

 
如右图所示,我们以本体为语义表示、以数据元素为数据表示,构建生物医学数据的标准化表示体系。
 

平台资源

MedPortal本体资源平台

收集中英文本体资源,可浏览、检索、注释收录的本体,并建立不同本体术语之间的映射

CDEPortal数据元素管理平台

收集和整合中英文数据元素资源,可浏览和检索临床和生物医学研究中常用的通用数据元素集

Scroll to top