Please wait a minute...
Advanced Search
现代图书情报技术  2015, Vol. 31 Issue (7-8): 89-96
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
陈挺, 韩涛, 李泽霞, 李国鹏, 王小梅
中国科学院文献情报中心 北京 100190
Research on Comparison Method of Scientific Funding Layout——Take NSF and EU FP Grants for Instance
Chen Ting, Han Tao, Li Zexia, Li Guopeng, Wang Xiaomei
National Science Library, Chinese Academy of Sciences, Beijing 100190, China
全文: PDF (1264 KB)   HTML  
输出: BibTeX | EndNote (RIS)      

目的】弥补目前科研项目布局分析往往局限在单一资助机构简单数量统计上的不足, 从内容上提高资助机构布局差异的揭示能力。【方法】针对多源项目数据, 提出一种基于文本K-means++聚类算法的分析方法, 尝试从科研项目内容揭示不同资助机构的资助方向和布局重点, 分析比较各资助机构在研究方向上的资助差异。【结果】使用美国NSF与欧盟FP资助的项目信息进行方法验证与案例分析, 发现相对于多个关键词, 基于单个关键词构建的文本特征空间有更好的聚类效果。进一步去除项目申请书摘要中项目背景、未来影响等干扰信息, 只保留研究内容、研究方法等实质性研究描述文本, K-means++算法的聚类效果有进一步提升。【局限】数据清洗尚不能完全自动实现, 聚类参数的预设与调整也需人工参与。【结论】实验与案例证明该方法是可行的, 分析结果能够比较直观地反映资助机构的布局差异, 对科研管理与决策者审视宏观科研布局、前瞻科技发展方向起到一定的辅助作用。

E-mail Alert

[Objective] This study targets to improve the ability to discover research layout of funding agencies based on their funding application documents. [Methods] The K-means++ clustering method is proposed to analyse the funding direction and main focus based on multiple sources of funding application documents. [Results] After validation and a case study based on the funding application abstracts from NSF and FP, it is discovered that single-word feature is more accurate than multi-word feature in the K-means++ clustering. If only keep the essential contents of application abstrcts as analysis documents, the accuracy of the K-means++ clustering is significantly improved. [Limitations] Data cleaning of the funding application documents is not fully automated. Adjustment of clustering parameters need to be manually controlled. [Conclusions] The K-means++ clustering of funding application documents is a practicable method by validation and case study. Research layout differences in agencies' funding trends are discovered and could be helpful for scientific management and policy decision.

收稿日期: 2014-12-18      出版日期: 2015-08-25
:  G250  


通讯作者: 陈挺, ORCID:: 0000-0003-4785-5367, E-mail:。     E-mail:
作者简介: 作者贡献声明: 童国平: 数据的获取与分析, 论文起草; 孙建军: 研究命题的提出、设计, 论文最终版本修订。
陈挺, 韩涛, 李泽霞, 李国鹏, 王小梅. 科研项目布局差异对比方法研究——以NSF和EUFP项目为例[J]. 现代图书情报技术, 2015, 31(7-8): 89-96.
Chen Ting, Han Tao, Li Zexia, Li Guopeng, Wang Xiaomei. Research on Comparison Method of Scientific Funding Layout——Take NSF and EU FP Grants for Instance. New Technology of Library and Information Service, 2015, 31(7-8): 89-96.
链接本文:      或

[1] 周兴明. 科学基金制是调控我国科学资源优化配置的重要手段——1982至1995年国家自然科学基金优化配制情况统计分析[J]. 科研管理, 1997, 18(6): 1-15. (Zhou Xingming. The Foundation System of Nature Science is an Important Means for Adjusting the Optimal Allocation of Science Research Resources in China ——The Statistic Analysis of the Projects Supported by the Foundations of Nature Science from 1982 to 1995 [J]. Science Research Management, 1997, 18(6): 1-15.)
[2] 陈丽贞, 李洁, 郑世珠, 等. 国家自然科学基金项目依托单位的分布统计研究[J]. 科研管理研究, 2008, 28: 106-108. (Chen Lizhen, Li Jie, Zheng Shizhu, et al. Statistical Distribution Research on Research Agency of National Natural Science Foundation of China [J]. Science and Technology Management Research, 2008, 28: 106-108.)
[3] 蒋颖, 阳宁晖, 刘筱敏, 等. 我国国家自然科学基金的地区分布研究[J]. 科学学与科学技术管理, 2003, 24(3): 5-10. Jiang Ying, Yang Ninghui, Liu Xiaomin, et al. Regional Distribution Research Based on National Natural Science Foundation of China [J]. Science of Science and Management of S.& T., 2003, 24(3): 5-10.)
[4] Eckhouse S, Lewison G, Sullivan R. Trends in the Global Funding and Activity of Cancer Research [J]. Molecular Oncology, 2008, 2(1): 20-32.
[5] 孙金伟, 刘迪, 王贤文, 等. 科学基金资助与SCI论文产出:对10个国家的比较分析[J]. 科学学研究, 2013, 31(1): 36-42. (Sun Jinwei, Liu Di, Wang Xianwen, et al. Science Funding and SCI Paper Output: A Comparative Analysis on 10 Countries [J]. Studies in Science of Science, 2013, 31(1): 36-42.)
[6] 王贤文, 刘则渊, 侯海燕. 全球主要国家的科学基金及基金论文产出现状: 基于Web of Science的分析[J]. 科学学研究, 2010, 28(1): 62-66. (Wang Xianwen, Liu Zeyuan, Hou Haiyan. Global Assessment of Science Funding and Funding Papers: A Study of Web of Science [J]. Studies in Science of Science, 2010, 28(1): 62-66.)
[7] 孟浩, 周立, 何建坤. 自然科学基金投入与科技论文产出的协整分析[J]. 科学学研究, 2007, 25(6): 1147-1150. (Meng Hao, Zhou Li, He Jiankun. The Co-integration Ananlysis on NSF Input and S& T Paper Output [J]. Studies on Science of Science, 2007, 25(6): 1147-1150.)
[8] 周小刚, 罗云峰. 1986-2006 年国家自然科学基金大气科学领域面上项目基金资助及成果统计分析[J]. 地球科学进展, 2007, 22(5): 540-546. Zhou Xiaogang, Luo Yunfeng. A Summary on General Program Projects in Atmospheric Science Funded by the National Natural Science Foundation of China from 1986 to 2006 [J]. Advances in Earth Science, 2007, 22(5): 540-546.)
[9] 相东升. 《情报科学》2001—2005年基金资助论文定量分析[J]. 情报科学, 2006, 24(10): 1501-1504. Xiang Dongsheng. Quantitative Analysis upon Fund-sponsored Theses in 2001-2005 Information Science [J]. Information Science, 2006, 24(10): 1501-1504.)
[10] Auranen O, Nieminen M. University Research Funding and Publication Performance—An International Comparison [J]. Research Policy, 2010, 39(6): 822-834.
[11] 马廷灿, 曹慕昆, 王桂芳. 从国家自然科学基金看我国各省市基础研究竞争力[J]. 科学通报, 2011, 56(36): 3115-3121. (Ma Tingcan, Cao Mukun, Wang Guifang. Analysis of the Regional Competitiveness of Basic Research in China Based on the National Natural Science Fundation of China [J]. Chinese Science Bulletin, 2011, 56(36): 3115-3121.)
[12] 华子春, 王雨轩. 基金相对资助率——反映国家自然科学基金竞争能力的一个新指标[J]. 中国科学基金, 2009, 23(1): 50-55. (Hua Zichun, Wang Yuxuan. The Relative Funding Rate —— A New Indicator Representing Competitiveness of the Grants from the National Natural Science Foundation [J]. Science Foundation in China, 2009, 23(1): 50-55.)
[13] Arthur D, Vassilvitskii S. K-means++: The Advantages of Careful Seeding [C]. In: Proceedings of the 18th Annual ACM-SIAM Symposium on Discrete Algorithms. Society for Industrial and Applied Mathematics, 2007: 1027-1035.
[14] 战略研究信息集成服务平台[EB/OL]. [2014-05-20]. http:// Integrated Information Platform for Strategic Research of CAS [EB/OL]. [2014-05-20]. http://
[15] AlchemyAPI [EB/OL]. [2014-05-20]. http://www.alchemyapi. com.
[16] K-means++[EB/OL]. [2014-07-13]. w/index.php?title=K-means%2B%2B.
[17] Moh'd B AI- Zoubi, Mohammad al Rawi. An Efficient Approach for Computing Silhouette Coefficients [J]. Journal of Computer Science, 2008, 4(3): 252.
[18] Rousseeuw P J. Silhouettes: A Graphical Aid to the Interpretation and Validation of Cluster Analysis[J]. Journal of Computational and Applied Mathematics, 1987, 20:53-65.
[19] Scikit-Learn [EB/OL]. [2014-05-14]. stable/_downloads/
[20] Rand W M. Objective Criteria for the Evaluation of Clustering Methods [J]. Journal of the American Statistical Association, 1971, 66(336): 846-850.
[21] Lawrence H, Phipps A. Comparing Partitions [J]. Journal of Classification, 1985, 2(1):193-218.

[1] 柴庆凤, 史霖炎, 梅珊, 熊海涛, 贺惠新. 基于人工特征和机器特征融合的科技文献知识元抽取*[J]. 数据分析与知识发现, 2021, 5(8): 132-144.
[2] 谭荧, 唐亦非. 基于指代消解的引文内容抽取研究*[J]. 数据分析与知识发现, 2021, 5(8): 25-33.
[3] 王勤洁, 秦春秀, 马续补, 刘怀亮, 徐存真. 基于作者偏好和异构信息网络的科技文献推荐方法研究*[J]. 数据分析与知识发现, 2021, 5(8): 54-64.
[4] 韩普,张展鹏,张明淘,顾亮. 基于多特征融合的中文疾病名称归一化研究*[J]. 数据分析与知识发现, 2021, 5(5): 83-94.
[5] 李贺,刘嘉宇,李世钰,吴迪,金帅岐. 基于疾病知识图谱的自动问答系统优化研究*[J]. 数据分析与知识发现, 2021, 5(5): 115-126.
[6] 李跃艳,王昊,邓三鸿,王伟. 近十年信息检索领域的研究热点与演化趋势研究——基于SIGIR会议论文的分析[J]. 数据分析与知识发现, 2021, 5(4): 13-24.
[7] 伊惠芳,刘细文. 一种专利技术主题分析的IPC语境增强Context-LDA模型研究[J]. 数据分析与知识发现, 2021, 5(4): 25-36.
[8] 王红斌,王健雄,张亚飞,杨恒. 主题不平衡新闻文本数据集的主题识别方法研究*[J]. 数据分析与知识发现, 2021, 5(3): 109-120.
[9] 常志军,钱力,谢靖,吴振新,张鹄,于倩倩,王颖,王永吉. 基于分布式技术的科技文献大数据平台的建设研究*[J]. 数据分析与知识发现, 2021, 5(3): 69-77.
[10] 胡少虎,张颖怡,章成志. 关键词提取研究综述*[J]. 数据分析与知识发现, 2021, 5(3): 45-59.
[11] 刘彤, 刘琛, 倪维健. 多层次数据增强的半监督中文情感分析方法 [J]. 数据分析与知识发现, 0, (): 1-.
[12] 王红斌, 王健雄, 张亚飞, 杨恒. 主题不平衡新闻文本数据集的主题识别方法研究 [J]. 数据分析与知识发现, 0, (): 1-.
[13] 张思凡, 牛振东, 陆浩, 朱一凡, 王荣荣. 基于图卷积嵌入与特征交叉的文献被引量预测方法:以交通运输领域为例 [J]. 数据分析与知识发现, 0, (): 1-.
[14] 祁瑞华, 简悦, 郭旭, 关菁华, 杨明昕. 融合特征与注意力的跨领域产品评论情感分析 [J]. 数据分析与知识发现, 0, (): 1-.
[15] 李娇, 黄永文, 罗婷婷, 赵瑞雪, 鲜国建. 基于多因子算法的自动分类研究 [J]. 数据分析与知识发现, 0, (): 1-.
Full text



版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190