top
请输入关键字
简介
科研大数据平台包含数据处理和科研应用两大中心,其中数据处理中心主要采用ETL、NLP等技术对来自临床的业务系统数据进行清洗,包含数据建模、入库、装载、转换、脱敏等处理。目前已产出乳腺癌专病库、新冠专病库、抑郁症专病库、肾脏病专病库、食管癌专病库,并支持数据溯源及安全等级管理。科研应用中心则是在专病库数据的基础上,提供数据申请、资源申请、数据检索、数据挖掘分析、临床数据采集、项目管理、教培管理等应用工具。支持科研工作的顺利、高效开展,其中数据检索支持结构化的条件检索、事件检索、联合检索,以及非结构化数据的NLP分词检索。数据挖掘分析支持50+中常规分析算法、支持上传管理自定义分析算法。
数据资源
公开数据库
食管癌数据库
乳腺癌数据库
肾病数据库
新冠肺炎数据库
抑郁症数据库
已开放数据库
COVIDanno:http://biomedbdc.wchscu.cn/COVIDanno/help/
StemDriver :http://biomedbdc.wchscu.cn/StemDriver/
COV2Var:http://biomedbdc.wchscu.cn/COV2Var
DASES:http://www.hxdsjzx.cn/DASES
TCRdb2:https://guolab.wchscu.cn/TCRdb2/#/
ICBcomb:https://guolab.wchscu.cn/ICBcomb/#/
liverdb:https://guolab.wchscu.cn/liverdb/#!/
ICBatlas:https://guolab.wchscu.cn/ICBatlas/#!/
LeukemiaDB:https://guolab.wchscu.cn/LeukemiaDB/#/
TCRdb:https://guolab.wchscu.cn/TCRdb/#/
PancanQTL:http://gong_lab.hzau.edu.cn/PancanQTL/
Pancan-meQTL:http://gong_lab.hzau.edu.cn/Pancan-meQTL/
eRNA_QTL:https://guolab.wchscu.cn/eRNA_QTL#!/
tRic:https://guolab.wchscu.cn/tRic/
PEA :https://guolab.wchscu.cn/PEA/#!/
EVAtlas :https://guolab.wchscu.cn/EVAtlas/#/
miRNASNP :https://guolab.wchscu.cn/miRNASNP/#!/
EVmiRNA :https://guolab.wchscu.cn/EVmiRNA/#!/
lncRNASNP :https://guolab.wchscu.cn/lncRNASNP/#!/
AnimalTFDB4:https://guolab.wchscu.cn/AnimalTFDB4/#/
hTFtarget :https://guolab.wchscu.cn/hTFtarget/#!/
AnimalTFDB :https://guolab.wchscu.cn/AnimalTFDB/#!/

工具
ImmuCellAI:https://guolab.wchscu.cn/ImmuCellAI/#!/
ImmuCellAI-mouse :https://guolab.wchscu.cn/ImmuCellAI-mouse/#!/
DeRR :https://guolab.wchscu.cn/DeRR/
TCRosetta :https://guolab.wchscu.cn/TCRosetta/#/
CCLA :https://guolab.wchscu.cn/CCLA/
CATT :https://guolab.wchscu.cn/CATT/Homepage.html
EVAtool :https://guolab.wchscu.cn/EVAtool/
FFLtool :https://guolab.wchscu.cn/FFLtool#!/
SEGtool :https://guolab.wchscu.cn/SEGtool/
访问数据库
建成食管癌专病数据库,汇聚华西医院多年来的病例数据,包括病因、病理、临床特征、临床诊疗、预后等多维度的数据。
其中包含7000余名食管癌患者相关人口统计学信息、患者入住院记录、入出院诊断、检验、检查、医嘱、病程,病理,影像等信息,为后续食管癌的诊疗与预防的科研提供数据支撑,为科研决策分析提供重要依据。同时包含400多名患者CT影像资料,已完成人工标注,对开展影像组学研究提供帮助。
建成乳腺癌专病数据库,包含1万余名患者约3480万条人口统计学信息、暴露/危险因素临床症状、患者月经生育史、患者住院记录、住院诊断、住院体格检查、住院影像、住院检验、住院诊疗计划、门诊/住院医嘱、现病史、出院小结以及随访等信息,全面挖掘数据价值应用,为后续乳腺癌诊疗与预防,以及科研提供数据支撑,以此建设科研专病数据库系统。
结合大数据治理技术,对大量数据清洗标化包括:数据抽取、数据转换、数据装载。深入结合医生团队,整合专业医学知识。使用NLP挖掘文本价值,将文本化病历形成结构化数据。数据清洗标化是不断重复的周期性的过程,为科研决策分析提供重要依据。
汇集华西医院历年来各信息系统的肾病病例信息,包括患者从门诊、住院以来所有的肾病所需信息。目前包含临床治疗以及随访数据约8155万条人口学信息、暴露/危险因素、疾病诊断、现病史、既往史、生育史、用药情况、检查情况、防治策略、慢病管理等多维度信息。围绕大数据驱动的肾脏病防治模式创新、肾脏病数据登记和信息化标准、肾脏病真实世界数据的共享机制,实现肾脏疾病相关数据的互联融合,开放共享。
以帮助研究者获得大量宝贵的病例资料,为高水平的临床科研提供坚实的基础。
与多家医疗机构合作,汇聚多源异构数据,包括人群移动轨迹数据、四川省多家医院发热门诊收治患者的诊疗记录、确诊及疑似患者临床诊疗数据、患者肺部影像数据、流行病学调查数据、气象环境数据等。
建成新冠诊疗专病数据库,包含600余名患者约5.7万条人口统计学信息、临床症状、实验室检验、CT检查、医嘱和护理记录,为后续新冠诊疗与防控的科研提供数据支撑。同时,及时清洗标化数据,顺利推进分析工作。
建成抑郁症专病数据库,包含6000余名患者约3880万条人口统计学信息、暴露/危险因素临床症状、患者住院记录、出院诊断、住院体格检查、住院检验、住院诊疗计划、门诊医嘱等信息,为后续抑郁症诊疗与预防的科研提供数据支撑。建设科研专病数据库系统。
完善的多源异构的数据治理技术,进行数据清洗包括:数据抽取、数据转换、数据装载。深入结合医生团队,整合专业医学知识,使用NLP挖掘文本价值,数据清洗标化是不断重复的周期性的过程,为科研决策分析提供重要依据。
形成可视化的数据分析,其中包括年龄分布、职业分布、地区分布、住院时长、愈后情况等,同时提供数据挖掘分析,便捷快速获得常规分析结果,深层次了解数据资源情况。