Please wait a minute...
Advanced Search
现代图书情报技术  2012, Vol. 28 Issue (1): 53-57    DOI: 10.11925/infotech.1003-3513.2012.01.09
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
科技文献全文主题识别方法实证研究
叶春蕾1,2,3, 冷伏海1
1. 中国科学院国家科学图书馆 北京 100190;
2. 中国科学院研究生院 北京 100049;
3. 北京城市学院信息学部 北京 100094
Theme Identification Empirical Study on Technical Documentation in Full-text
Ye Chunlei1,2,3, Leng Fuhai1
1. National Science Library, Chinese Academy of Sciences, Beijing 100190, China;
2. Graduate University of Chinese Academy of Sciences, Beijing 100049, China;
3. Information Department, Beijing City University, Beijing 100094, China
全文: PDF(462 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 利用基于多词短语词频分析和短语邻近分析的DT方法,结合学科领域术语识别内容,对美国国家航空航天局2011-2020年战略规划做全文主题识别。实验证明,改进的DT方法可以有效地识别全文文献主题,一定程度上能够简化情报研究人员的工作。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
叶春蕾
冷伏海
关键词 共词分析主题识别DT术语识别    
Abstract:This paper proposes an improved DT method to identify the theme of the NASA 2011-2020 strategic plan based on multi-word phrases frequency analysis and phrases proximity analysis, adding the term identification of subject. Experiment proves that the improved DT method can identify the theme of documentation in full-text effectively and simply the work of intelligences to some extent.
Key wordsCo-word analysis    Theme identification    DT    Term identification
收稿日期: 2011-11-03     
: 

G350

 
引用本文:   
叶春蕾, 冷伏海. 科技文献全文主题识别方法实证研究[J]. 现代图书情报技术, 2012, 28(1): 53-57.
Ye Chunlei, Leng Fuhai. Theme Identification Empirical Study on Technical Documentation in Full-text. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2012.01.09.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2012.01.09
[1] 靖继鹏, 马费成, 张向先. 情报科学理论[M]. 北京: 科学出版社, 2009: 231-236.

[2] 冷伏海, 吴霞. 基于文献的知识挖掘:概念、关键技术与应用[M].北京:国防工业出版社, 2008:271-306.

[3] 张晗, 崔雷. 生物信息学的共词分析研究[J]. 情报学报 , 2003, 22(5): 613-617.

[4] Kostoff R N, Miles D L, Eberhart H J. System and Method for Database Tomography: U.S., 5440481[P].1995-08-08.

[5] Kostoff R N,Eberhart H J,Toothman D R.Database Tomography for Information Retrieval[J].Journal of Information Science,1997,23(4):301-311.

[6] Kostoff R N, DeMarco R A. Science and Technology Text Mining: Analytical Chemistry[R]. Arlington: Office of Naval Research, 2003:10,20-22.

[7] Kostoff R N, Eberhart H J,Toothman D R,et al.Database Tomography for Technical Intelligence: Comparative Roadmaps of the Research Impact Assessment Literature and the Journal of the American Chemical Society[J].Scientometrics,1997,40(1):103-138.

[8] Kostoff R N, Shlesinger M F, Tshiteya R. Nonlinear Dynamics Text Mining Using Bibliometrics and Database Tomography[J]. International Journal of Bifurcation and Chaos,2004,14(1):61-92.

[9] Kostoff R N, Eberhart H J, Toothman D R. Hypersonic and Supersonic Flow Roadmaps Using Bibliometrics and Database Tomography[J].Journal of the American Society for Information Science,1999,50(5):427-447.

[10] Kostoff R N, Block J A. Context-dependent Conflation, Text Filtering and Clustering[R]. Arlington: Office of Naval Research, 2004:32-40.

[11] 冯璐, 冷伏海. 共词分析方法理论进展[J]. 中国图书馆学报 , 2006,32(2):88-92.

[12] 赵凡,马胜利.数据库内容结构分析法的理论与实践进展研究[J]. 情报理论与实践 ,2008,31(2): 279-282.

[13] 王立学, 冷伏海. 基于文本结构解析的动态共词方法研究[J]. 图书情报工作 , 2010, 54(24):37-40.

[14] Callon M, Law J, Rip A.Mapping the Dynamics of Science and Technology:Sociology of Science in the Real World[M].London: The Macmillan Press LTD, 1986:103-141.

[15] Callon M, Courtial J P, Laville F. Co-word Analysis as a Tool for Describing the Network of Interactions Between Basic and Technological Research: The Case of Polymer Chemistry[J]. Scientometrics, 1991,22(1):155-205.

[16] TerMine [EB/OL]. [2011-12-03]. http://www.nactem.ac.uk/software/termine/.

[17] TerMine Plugin for Protégé 4[EB/OL]. [2011-12-03]. http://www.co-ode.org/downloads/protege-x/plugins/termine-docs.pdf.

[18] Frantzi K T, Ananiadou S, Tsujii J. The C-value/NC-value Method of Automatic Recognition for Multi-word Terms[C]. In: Proceedings of the 2nd European Conference on Research and Advanced Technology for Digital Libraries. 1998: 585-604.

[19] National Aeronautics and Space Administration. 2011 NASA Strategic Plan [EB/OL]. [2011-08-05].http://www.nasa.gov/pdf/516579main_NASA2011StrategicPlan.pdf.
[1] 程齐凯,王佳敏,陆伟. 基于引用共词网络的领域基础词汇发现研究*[J]. 数据分析与知识发现, 2019, 3(6): 57-65.
[2] 徐路路,王效岳,白如江,周彦廷. 基于DTM模型和文本特征分析的基金项目新兴趋势探测研究* ——以NSF石墨烯领域为例[J]. 数据分析与知识发现, 2018, 2(3): 87-97.
[3] 李真,丁晟春,王楠. 网络舆情观点主题识别研究*[J]. 数据分析与知识发现, 2017, 1(8): 18-30.
[4] 何远标, 乐小虬, 张帆. 学术论文大纲中关键术语抽取方法研究[J]. 现代图书情报技术, 2014, 30(3): 73-79.
[5] 赵宇翔,彭希羡. 媒体即社区?信息系统领域基于文献的研究主题分析*[J]. 现代图书情报技术, 2014, 30(1): 56-65.
[6] 胡昌平, 陈果. 共词分析中的词语贡献度特征选择研究[J]. 现代图书情报技术, 2013, 29(7/8): 89-93.
[7] 唐晓波, 肖璐. 融合关键词增补与领域本体的共词分析方法研究[J]. 现代图书情报技术, 2013, 29(11): 60-67.
[8] 谷俊. 专利文献中新技术术语识别研究[J]. 现代图书情报技术, 2012, (11): 53-59.
[9] 陆伟, 彭玉, 陈武. 基于SOM的领域热点主题探测[J]. 现代图书情报技术, 2011, 27(1): 63-68.
[10] 杨颖, 崔雷. 应用改进的共词聚类法探索医学信息学热点主题演变[J]. 现代图书情报技术, 2011, 27(1): 83-87.
[11] 王立学,冷伏海,王海霞. 技术成熟度及其识别方法研究*[J]. 现代图书情报技术, 2010, 26(3): 58-63.
[12] 储久良. 利用开源软件构建校园网络设备监控平台*[J]. 现代图书情报技术, 2010, 26(2): 85-90.
[13] 许德山, 张智雄, 王峰, 邢美凤. 上下文分析与统计特征相结合的英文术语抽取研究[J]. 现代图书情报技术, 2010, 26(12): 28-33.
[14] 李树青,程国达,王维民. 基于加权XML模型的XML数据与DTD模式匹配*[J]. 现代图书情报技术, 2010, 26(1): 57-65.
[15] 陈仕吉. 科学研究前沿探测方法综述[J]. 现代图书情报技术, 2009, (9): 28-33.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn