Please wait a minute...
Advanced Search
数据分析与知识发现  2017, Vol. 1 Issue (1): 16-25     https://doi.org/10.11925/infotech.2096-3467.2017.01.03
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
针对科技路线图的文本挖掘研究: 集成分析及可视化*
谢秀芳1,2(), 张晓林1
1中国科学院文献情报中心 北京 100190
2首都医科大学卫生管理与教育学院 / 首都医科大学图书馆 北京 100069
Integrated Analysis and Visualization of Sci-Tech Roadmaps: Case Study of Renewable Energy
Xie Xiufang1,2(), Zhang Xiaolin1
1National Science Library, Chinese Academy of Sciences, Beijing 100190, China
2School of Health Management and Education, Capital Medical University/Library of Capital Medical University,Beijing 100069, China
全文: PDF (6814 KB)   HTML ( 64
输出: BibTeX | EndNote (RIS)      
摘要 

目的】实现针对科技路线图内容的知识发现研究, 预测未来科技长期发展趋势。【方法】基于采用“抽取-同步-分类”的文本挖掘方法构建的科技路线图信息库, 集成分析全球科技发展需求和趋势, 对比分析各国发展路线和措施, 并以可再生能源领域为案例进行实证研究。【结果】利用开源工具Timeflow、Gephi等对实证研究结果进行可视化, 按时间序列从多个角度呈现了可再生能源领域到2050年的发展态势及各国的战略规划。【局限】综合利用了多种方法工具, 自动化程度有待提高, 个性化功能有待完善。【结论】该研究方案能够快速获取科技路线图中的核心信息, 提高情报获取效率。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
谢秀芳
张晓林
关键词 科技路线图战略情报文本挖掘知识发现集成分析信息可视化    
Abstract

[Objective]This study aims to predict the development trends of science and technology (S&T) with knowledge extracted from S&T roadmaps (STR). [Methods] First, we constructed an STR information database based on the “extraction - synchronization - classification” method of text mining. Second, we analysed the demands and trends of global S&T progress. Finally, we compared and analyzed different countries’ S&T strategies in the field of renewable energy. [Results] We used open source tools, such as Timeflow, Gephi to visualize the results of this case study, such as the globle development trends and national strategic planning in the field of renewable energy by 2050. [Limitations] The automation and personalization features of this study need to be improved. [Conclusions] The proposed method could retrieve strategic intelligence from the STRs effectively.

Key wordsScience and Technology Roadmap    Strategic Intelligence    Text Mining    Knowledge Discovery    Integrated Analysis    Information Visualization
收稿日期: 2016-09-30      出版日期: 2017-02-22
ZTFLH:  G356.4  
基金资助:*本文系中国科学院规划与决策科技支持系统建设项目“科技决策知识服务平台”(项目编号: 院1405)的研究成果之一
引用本文:   
谢秀芳, 张晓林. 针对科技路线图的文本挖掘研究: 集成分析及可视化*[J]. 数据分析与知识发现, 2017, 1(1): 16-25.
Xie Xiufang,Zhang Xiaolin. Integrated Analysis and Visualization of Sci-Tech Roadmaps: Case Study of Renewable Energy. Data Analysis and Knowledge Discovery, 2017, 1(1): 16-25.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2017.01.03      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2017/V1/I1/16
  科技路线图信息库构成字段
  科技路线图语义分类信息取值
规则 描述 操作
计算符号(+/-)的判定规则(决定在时间t
的基础上执行“加”或“减”操作)
过去时间 over/past/previous/recent/preceding/last等, 符号取“-”
将来时间 next/following/coming/later等, 符号取“+”
计算加数或减数的取值规则(在时间t
的基础上执行加减的数值n)
单数 year: n=1; decade: n=10; century: n=100
two/three/ten/20等后接复数 years: 取相应数字, 即n=2/3/10/20等
decades: 取相应数字乘以10, 即n=10×(2/3/10/20)等
centuries: 取相应数字乘以100, 即n=100×(2/3/10/20)等
few/several/some等后接复数 years: n=5; decades: n=50; centuries: n=500
  时间词计算规则
条件 赋值
当前时间(如today/present/current/now) 赋值为发表年份t
beginning/early/dawn/start of century/decade 赋值为该10年或世纪开始的年份
end/late of decade/century 赋值为该10年或世纪结束的年份
时间词为空(不包含且未能继承时间信息) Classification_1=“today” 即属于现状, 赋予发表年份t
Classification_1=“vision” 即属于愿景, 赋予最后一个规划节点年份
Classification_1=“pathway”/“action” 即属于路线或措施, 赋予整个规划区间
Classification_1=“other” 即属于其它, 赋予t-1, 作为其它背景信息
  时间词赋值规则
功能目标 参数设置 公共配置
发展愿景
分析
Classification_1=“vision”;
Classification_2=“target”;
x轴: time;
y轴: Classification_3;
发展路线
分析
Classification_1=“pathway”;
Classification_2=“target”;
权重: Weight;
颜色: Classification_4;
发展战略
分析
Classification_1=“action”;
Classification_2=“target &
need & barrier & enabler”;
节点: Keyword;
详情: 鼠标悬停节点显
示原句及所属全部信息
字段;
  针对关注对象在某个领域的战略分析参数设置
  可再生能源领域的发展需求
(注: 参数设置Classification_1 =“today”, Classification_2 =“need”, Year≥2015)
  可再生能源领域的发展趋势
(注: 参数设置Classification_1 =“vision”, Classification_2 =“trend & potential & opportunity”, Year≥2015)
  可再生能源领域的技术发展态势
  可再生能源领域的技术发展方向
  可再生能源领域的技术发展路径
  中美可再生能源领域的发展战略对比
[1] 刘细文, 柯春晓.技术路线图的应用研究及其对战略情报研究的启示[J]. 图书情报工作, 2007, 51(6): 37-40, 112.
[1] (Liu Xiwen, Ke Chunxiao.The Applications of Technology Roadmap and Its Enlightenment to Strategic Intelligence Research[J]. Library and Information Service, 2007, 51(6): 37-40, 112.)
[2] Zhang Y, Zhang G, Chen H, et al.Topic Analysis and Forecasting for Science, Technology and Innovation: Methodology with a Case Study Focusing on Big Data Research[J]. Technological Forecasting and Social Change, 2016, 105: 179-191.
doi: 10.1016/j.techfore.2016.01.015
[3] Amer M, Daim T U, Jetter A.Technology Roadmap Through Fuzzy Cognitive Map-Based Scenarios: The Case of Wind Energy Sector of a Developing Country[J]. Technology Analysis & Strategic Management, 2016, 28(2): 131-155.
[4] Jin G, Jeong Y, Yoon B.Technology-driven Roadmaps for Identifying New Product/Market Opportunities: Use of Text Mining and Quality Function Deployment[J]. Advanced Engineering Informatics, 2015, 29(1): 126-138.
doi: 10.1016/j.aei.2014.11.001
[5] 叶春蕾, 冷伏海. 技术路线图中未来技术词表构建方法研究[J]. 现代图书情报技术, 2013(5): 59-63.
[5] (Ye Chunlei, Leng Fuhai.Building the Future—Oriented Technology Thesaurus of Technology Roadmap[J]. New Technology of Library and Information Service, 2013(5): 59-63.)
[6] 叶春蕾, 冷伏海. 基于词汇链的路线图关键词抽取方法研究[J]. 现代图书情报技术, 2013(1): 50-56.
[6] (Ye Chunlei, Leng Fuhai.Study on the Keyword Extraction from Roadmap Based on the Lexical Chains[J]. New Technology of Library and Information Service, 2013(1): 50-56.)
[7] Amer M, Daim T U.Application of Technology Roadmaps for Renewable Energy Sector[J]. Technological Forecasting and Social Change, 2010, 77(8): 1355-1370.
doi: 10.1016/j.techfore.2010.05.002
[8] Bader B, Richardson C, Tsuriya M.Technology Roadmap Overviews and Future Direction through Technology Gaps[C]// Proceedings of the 2015 International Conference on Electronics Packaging. 2015.
[9] 谢秀芳, 张晓林. 针对科技路线图的文本挖掘研究框架及特征分析[J]. 情报科学. (待发)..
doi: 10.3969/j.issn.1002-1965.2016.02.009
[9] (Xie Xiufang, Zhang Xiaolin.Text-mining Framework and Feature Analysis on Science and Technology Roadmap [J]. Information Science. In Press.)
doi: 10.3969/j.issn.1002-1965.2016.02.009
[10] 谢秀芳, 张晓林. 针对科技路线图的文本挖掘研究: 信息抽取方法[J]. 情报理论与实践. (待发).
doi: 10.3969/j.issn.1674-1374-B.2002.z1.012
[10] (Xie Xiufang, Zhang Xiaolin.The Research on Text-mining of Science and Technology Roadmap: Method of Information Extraction[J]. Information Studies: Theory & Application. In Press.)
doi: 10.3969/j.issn.1674-1374-B.2002.z1.012
[11] Timeflow [EB/OL]. [2016-07-22]..
[12] 史磊, 王永成. 英文文献自动摘要系统的研制与开发[J]. 高技术通讯, 1999, 9(11): 22-26.
[12] (Shi Lei, Wang Yongcheng.Research and Development of an Automatic Abstracting System for English Documents[J]. Chinese High Technology Letters, 1999, 9(11): 22-26.)
[13] Gephi [EB/OL]. [2016-07-22]..
[1] 黄名选,蒋曹清,卢守东. 基于词嵌入与扩展词交集的查询扩展*[J]. 数据分析与知识发现, 2021, 5(6): 115-125.
[2] 许光,任明,宋城宇. 西方媒体新闻中的中国经济形象提取*[J]. 数据分析与知识发现, 2021, 5(5): 30-40.
[3] 代冰,胡正银. 基于文献的知识发现新近研究综述 *[J]. 数据分析与知识发现, 2021, 5(4): 1-12.
[4] 余传明, 王曼怡, 林虹君, 朱星宇, 黄婷婷, 安璐. 基于深度学习的词汇表示模型对比研究*[J]. 数据分析与知识发现, 2020, 4(8): 28-40.
[5] 夏天. 面向中文学术文本的单文档关键短语抽取 *[J]. 数据分析与知识发现, 2020, 4(7): 76-86.
[6] 马建霞,袁慧,蒋翔. 基于Bi-LSTM+CRF的科学文献中生态治理技术相关命名实体抽取研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 78-88.
[7] 胡正银,刘蕾蕾,代冰,覃筱楚. 基于领域知识图谱的生命医学学科知识发现探析*[J]. 数据分析与知识发现, 2020, 4(11): 1-14.
[8] 杜建. 医学知识不确定性测度的进展与展望*[J]. 数据分析与知识发现, 2020, 4(10): 14-27.
[9] 关鹏,王曰芬. 国内外专利网络研究进展*[J]. 数据分析与知识发现, 2020, 4(1): 26-39.
[10] 黄名选,卢守东,徐辉. 基于加权关联模式挖掘与规则后件扩展的跨语言信息检索 *[J]. 数据分析与知识发现, 2019, 3(9): 77-87.
[11] 胡佳慧,方安,赵琬清,杨晨柳,任慧玲. 面向知识发现的中文电子病历标注方法研究 *[J]. 数据分析与知识发现, 2019, 3(7): 123-132.
[12] 杨亚楠,赵文辉,张健,谭珅,张贝贝. 基于多视图协同的政策文本可视化研究*[J]. 数据分析与知识发现, 2019, 3(6): 30-41.
[13] 张梦吉,杜婉钰,郑楠. 引入新闻短文本的个股走势预测模型[J]. 数据分析与知识发现, 2019, 3(5): 11-18.
[14] 吴菊华,王煜,黎明,蔡少云. 基于加权知识网络的在线健康社区用户知识发现*[J]. 数据分析与知识发现, 2019, 3(2): 108-117.
[15] 杨磊,王子润,侯贵生. 基于Q-LDA主题模型的网络健康社区主题挖掘研究 *[J]. 数据分析与知识发现, 2019, 3(11): 52-59.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn