Please wait a minute...
Advanced Search
数据分析与知识发现  2020, Vol. 4 Issue (12): 2-13     https://doi.org/10.11925/infotech.2096-3467.2020.0954
     专题 本期目录 | 过刊浏览 | 高级检索 |
面向人口健康领域科研项目数据汇交的数据仓储设计与实现*
吴思竹1,钱庆1(),周伟2,钟明1,王安然1,修晓蕾1,苟欢1,李赞梅1,李姣1,方安1
1中国医学科学院/北京协和医学院 医学信息研究所/图书馆 北京100020
2国家人口健康科学数据中心 北京 100005
Data Archive for Research Projects in Population Health
Wu Sizhu1,Qian Qing1(),Zhou Wei2,Zhong Ming1,Wang Anran1,Xiu Xiaolei1,Gou Huan1,Li Zanmei1,Li Jiao1,Fang An1
1Institute of Medical Information/Medical Library, Chinese Academy of Medical Science & Peking Union Medical College, Beijing 100020, China
2National Population Health Data Center, Beijing 100005, China
全文: PDF (3970 KB)   HTML ( 21
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】 为国家财政支持的人口健康领域科研项目数据汇交和管理提供重要基础支撑,重点介绍国家人口健康科学数据中心数据仓储 (Population Health Data Archive,PHDA)在科研项目数据汇交方面的功能设计和实施方法。【方法】 分析人口健康领域科研项目数据汇交流程特点,构建满足国家财政预算支持的科研项目数据汇交和管理迫切需求的数据仓储,设计形成灵活、可扩展的总体框架和友好易用的功能模块。【结果】 PHDA实现项目信息注册、项目数据汇交、大数据高速传输、安全保藏、数据唯一标识分配、分级分类存储、访问控制和凭证发放等功能,已有效支撑国家科技基础性工作专项14个项目,292个数据集的汇交工作。【局限】 还需运用数据语义化和深度学习等技术实现增强数据管理、数据语义融合和智能化数据分析服务,优化仓储功能。【结论】 PHDA实现人口健康领域科研项目数据汇交管理与共享利用,对国家人口健康领域科学数据的汇聚、积累和安全保障具有重要意义。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
吴思竹
钱庆
周伟
钟明
王安然
修晓蕾
苟欢
李赞梅
李姣
方安
关键词 科研项目数据汇交数据管理人口健康    
Abstract

[Objective] This study focuses on the design and implementation of the Population Health Data Archive (PHDA), aiming to support data curation of research projects supported by the government. [Methods] First, we analyzed the data curation characteristics of research projects on population health. Then, we constructed a data archive for their urgent needs. Our system includes flexible and scalable framework, as well as user friendly functional modules. [Results] The PHDA finished the tasks of project registration, data collection, big data high-speed transmission, security preservation, distribution of unique dataset identifiers, effective storage, access control and voucher issuance. In 2019, our system administrated 292 datasets for 14 projects from the National Special Program on Basic Works for Science and Technology. [Limitations] The PHDA could be optimized with more data semantics and deep learning technologies (i.e., intelligent data analysis services). [Conclusions] The PHDA could effectively curate and disseminate shared research data in the field of national population health.

Key wordsResearch Project    Data Collection    Data Management    Population Health
收稿日期: 2020-09-27      出版日期: 2020-12-25
ZTFLH:  G203  
基金资助:*国家重点研发计划精准医学研究重点专项课题“重大疾病精准医学数据库群”(2016YFC0901602);基地和人才专项科技基础条件平台专项课题“PHDA国际认证与规范化实施”(NCMI-KD01N-202006);中国医学科学院医学与健康科技创新工程重大创新项目“人口健康科学数据中心及新冠肺炎相关数据资源整合平台建设”(2020-I2M-2-001)
通讯作者: 钱庆     E-mail: qian.qing@imicams.ac.cn
引用本文:   
吴思竹, 钱庆, 周伟, 钟明, 王安然, 修晓蕾, 苟欢, 李赞梅, 李姣, 方安. 面向人口健康领域科研项目数据汇交的数据仓储设计与实现*[J]. 数据分析与知识发现, 2020, 4(12): 2-13.
Wu Sizhu, Qian Qing, Zhou Wei, Zhong Ming, Wang Anran, Xiu Xiaolei, Gou Huan, Li Zanmei, Li Jiao, Fang An. Data Archive for Research Projects in Population Health. Data Analysis and Knowledge Discovery, 2020, 4(12): 2-13.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2020.0954      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2020/V4/I12/2
Fig.1  人口健康领域科研项目数据汇交流程
Fig.2  PHDA项目数据汇交和管理功能设计框架
序号 用户角色 角色说明 权限描述
1 科研项目管理者 科研项目管理部门或机构 查看和管理某一特定项目数据汇交和共享情况
2 项目负责者 负责科研项目研究和科研项目数据汇交 创建项目账号,进行项目数据注册、上传、提交和管理
3 课题/子项目负责者 项目下课题或子项目的负责人 创建项目下的课题/子项目账号,进行课题/子项目数据注册、上传、提交和管理
4 数据仓储管理者 项目数据仓储管理人员 项目信息审核、项目数据审核、项目数据管理和出具项目数据验收凭证等
5 项目数据评审者 不同领域的项目数据评估审核专家 项目数据评估审核
6 项目数据审编者 项目信息及项目数据审编人员 编辑、规范、优化项目信息及项目数据描述等
7 机构科学数据管理者 各机构科学数据管理人员 查看和管理该机构科研项目数据汇交和共享情况
8 数据使用者 不同类型和层次的数据使用用户 根据不同权限进行项目信息浏览、项目元数据访问、项目数据申请等
Table 1  PHDA项目数据汇交和管理中相关用户角色及权限设置
Fig.3  项目数据汇交流程
Fig.4  项目数据在线自动审核流程
Fig.5  项目数据多维可视化交互流程和效果
Fig.6  项目数据列表页
[1] National Science Foundation. Applications Grants.gov Application Guide: A Guide for Preparation and Submission of NSF Applications via Grants.gov [EB/OL]. [2020-07-07]. https://nsf.gov/pubs/policydocs/grantsgovguide0620.pdf.
[2] National Institutes of Health. NIH Data Sharing Policy and Implementation Guidance [EB/OL].[2020-07-07]. https://grants.nih.gov/grants/policy/data_sharing/data_sharing_guidance.htm.
[3] National Institutes of Health. National Institutes of Health Genomic Data Sharing Policy [EB/OL].[2020-07-06]. https://osp.od.nih.gov/wp-content/uploads/NIH_GDS_Policy.pdf.
[4] National Institutes of Health. DRAFT NIH Policy for Data Management and Sharing [EB/OL].[2020-07-06]. https://osp.od.nih.gov/wp-content/uploads/Draft_NIH_Policy_Data_Management_and_Sharing.pdf.
[5] European Commission. A European Strategy for Data [EB/OL]. [2020-07-06].https://eur-lex.europa.eu/legal-content/EN/TXT/?qid=1593073685620&uri=CELEX%3A52020DC0066.
[6] Directorate-General for Research and Innovation of European Commission. H2020 Programme Guidelines on FAIR Data Management in Horizon 2020 [EB/OL]. [2020-07-06]. https://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf
[7] 王卷乐, 祝俊祥, 杨雅萍 , 等. 国外科技计划项目数据汇交政策及对我国的启示[J]. 中国科技资源导刊, 2013,45(2):17-23.
[7] ( Wang Juanle, Zhu Junxiang, Yang Yaping , et al. Edifying by Data Archiving Policy of International Science and Technology Research Program to China[J]. China Science & Technology Resources Review, 2013,45(2):17-23.)
[8] 司莉, 邢文明 . 国外科学数据管理与共享政策调查及对我国的启示[J]. 情报资料工作, 2013(1):62-67.
[8] ( Si Li, Xing Wenming . Scientific Data Management and Sharing Policies in Foreign Countries: Investigation and Inspiration to Us[J]. Information and Documentation Services, 2013(1):62-67.)
[9] 唐源, 吴丹 . 国外医学科学数据共享政策调查及对我国的启示[J]. 图书情报工作, 2015,59(18):8-15.
[9] ( Tang Yuan, Wu Dan . Investigation on Foreign Medical Scientific Data Sharing Policies and Enlightenments to China[J]. Library and Information Service, 2015,59(18):8-15.)
[10] 孙小康, 吴思竹, 修晓蕾 , 等. 国外科学数据管理与共享政策及对我国精准医学数据管理的启示[J]. 医学信息学杂志, 2018,39(4):58-65.
[10] ( Sun Xiaokang, Wu Sizhu, Xiu Xiaolei , et al. Overseas Scientific Data Management and Sharing Policies and Its Enlightenment to Precision Medical Data Management in China[J]. Journal of Medical Intelligence, 2018,39(4):58-65.)
[11] 王卷乐, 杨亚萍, 诸云强 , 等. “973”计划资源环境领域数据汇交进展与数据分析[J]. 地球科学进展, 2008,23(8):895-896.
[11] ( Wang Juanle, Yang Yapping, Zhu Yunqiang , et al. Data Archiving Progress and Data Types Analysis of National Basic Research Program of China (973 Program) in Resource and Environment Field[J]. Advances in Earth Science, 2008,23(8):895-896.)
[12] 王卷乐, 孙九林, 杨雅萍 , 等. 973计划资源环境领域项目数据汇交实践与思考[J]. 中国科技资源导刊, 2011,43(3):1-5.
[12] ( Wang Juanle, Sun Jiulin, Yang Yaping , et al. Data Archiving Practice and Consideration of National Basic Research Program of China (973 Program) in Resource and Environment Field[J]. China Science & Technology Resources Review, 2011,43(3):1-5.)
[13] 杨杰, 宋佳, 诸云强 , 等. 科技基础性工作专项数据汇交共享平台建设[J]. 中国科技资源导刊, 2017,49(5):52-59, 67.
[13] ( Yang Jie, Song Jia, Zhu Yunqiang , et al. Construction of Special Data Archiving and Sharing Platform for the Science and Technology Basic Work[J]. China Science & Technology Resources Review, 2017,49(5):52-59, 67.)
[14] 杨阳, 尹爱宁, 刘静 , 等. 中国中医科学院科研项目管理汇交平台建设[ C]//中国中医科学院中医药信息研究所学术年会. 2008.
[14] ( Yang Yang, Yin Aining, Liu Jing , et al. Construction of Platform for Research Project Management and Collection of Chinese Academy of Chinese Medicine Sciences[C]// Proceedings of Annual Meeting of Institute of Information on Traditional Chinese Medicine, Chinese Academy of Chinese Medicine Sciences. 2008. )
[15] 刘燕, 陈艳, 杨彦臣 , 等. 林业基础性工作专项成果汇交数据资料的分析整编[J]. 中国科技资源导刊, 2017,49(5):82-88.
[15] ( Liu Yan, Chen Yan, Yang Yanchen , et al. Analysis and Compiling of Data Materials about Achievements of Forestry Fundamental Special Projects[J]. China Science & Technology Resources Review, 2017,49(5):82-88.)
[16] 刘军 . 山西省科技计划项目科学数据汇交与共享[J]. 科技情报开发与经济, 2014,24(5):129-131.
[16] ( Liu Jun . Discussion on the Collecting and Sharing of Scientific Data of the Projects of Shanxi’s Scientific and Technological Plans[J]. Sci-Tech Information Development & Economy, 2014,24(5):129-131.)
[17] 钟明, 吴思竹, 钱庆 , 等. 面向我国人口与健康领域数据汇交的科研项目调查策略[J]. 中华医学图书情报杂志, 2018,27(10):20-27.
[17] ( Zhong Ming, Wu Sizhu, Qian Qing , et al. Research on the Investigation Strategy of Scientific Research Projects in China’s Population and Health Fields for Data Collection[J]. Chinese Journal of Medical Library and Information Science, 2018,27(10):20-27.)
[1] 淮孟姣, 潘云涛, 袁军鹏. 科研项目负责人的信用评价指标体系建设研究*[J]. 数据分析与知识发现, 2017, 1(11): 94-102.
[2] 刘峰,黎建辉,张进,韩芳,刘昂. TeamDR:面向科研团队的数据知识库管理系统*[J]. 现代图书情报技术, 2016, 32(3): 82-89.
[3] 刘峰, 张晓林. 数据管理计划构成规范及其可操作数据监护模型研究*[J]. 现代图书情报技术, 2016, 32(1): 11-16.
[4] 张梦霞,顾立平. 数据监管的政策研究综述*[J]. 现代图书情报技术, 2016, 32(1): 3-10.
[5] 陈挺, 韩涛, 李泽霞, 李国鹏, 王小梅. 科研项目布局差异对比方法研究——以NSF和EUFP项目为例[J]. 现代图书情报技术, 2015, 31(7-8): 89-96.
[6] 孙轶楠, 顾立平, 宋秀芳, 刘晶晶, 江娴. 学科数据知识库的政策调研与分析——以生命科学领域为例[J]. 现代图书情报技术, 2015, 31(12): 13-20.
[7] 王辉, Michael Witt, 窦天芳. 普渡大学研究仓储及其支持的科学数据管理服务[J]. 现代图书情报技术, 2015, 31(1): 9-16.
[8] Heinz Pampel, Paul Vierkant, Frank Scholze, Roland Bertelmann, Maxi Kindling, Jens Klump, Hans-Jürgen Goebelbecker, Jens Gundlach, Peter Schirmbacher, Uwe Dierolf . 呈现科研数据知识库:re3data.org注册机制[J]. 现代图书情报技术, 2014, 30(3): 26-34.
[9] 刘峰, 张晓林, 孔丽华. 科研数据知识库研究述评[J]. 现代图书情报技术, 2014, 30(2): 25-31.
[10] 吴振新, 齐燕, 付鸿鹄, 刘超, 李文燕, 刘晓敏, 王玉菊. 基础设施、情报、创新:启动数据科学的研究历程——IDCC2013会议综述[J]. 现代图书情报技术, 2013, 29(7/8): 13-21.
[11] 高国伟,王延章,王宁. 基于元数据管理模型的电子政务公文系统应用研究*[J]. 现代图书情报技术, 2008, 24(6): 28-33.
[12] 谈春梅. 会议文献数据库系统的开发与设计[J]. 现代图书情报技术, 2004, 20(12): 51-54.
[13] 周宁丽,朱献有,姚国昌,崔淑兰,苑玉兰,谭宗颖. 中国物理学文献数据库系统建设[J]. 现代图书情报技术, 1995, 11(4): 45-48.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn