Please wait a minute...
Advanced Search
现代图书情报技术  2012, Vol. 28 Issue (1): 53-57     https://doi.org/10.11925/infotech.1003-3513.2012.01.09
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
科技文献全文主题识别方法实证研究
叶春蕾1,2,3, 冷伏海1
1. 中国科学院国家科学图书馆 北京 100190;
2. 中国科学院研究生院 北京 100049;
3. 北京城市学院信息学部 北京 100094
Theme Identification Empirical Study on Technical Documentation in Full-text
Ye Chunlei1,2,3, Leng Fuhai1
1. National Science Library, Chinese Academy of Sciences, Beijing 100190, China;
2. Graduate University of Chinese Academy of Sciences, Beijing 100049, China;
3. Information Department, Beijing City University, Beijing 100094, China
全文: PDF (462 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 利用基于多词短语词频分析和短语邻近分析的DT方法,结合学科领域术语识别内容,对美国国家航空航天局2011-2020年战略规划做全文主题识别。实验证明,改进的DT方法可以有效地识别全文文献主题,一定程度上能够简化情报研究人员的工作。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
叶春蕾
冷伏海
关键词 共词分析主题识别DT术语识别    
Abstract:This paper proposes an improved DT method to identify the theme of the NASA 2011-2020 strategic plan based on multi-word phrases frequency analysis and phrases proximity analysis, adding the term identification of subject. Experiment proves that the improved DT method can identify the theme of documentation in full-text effectively and simply the work of intelligences to some extent.
Key wordsCo-word analysis    Theme identification    DT    Term identification
收稿日期: 2011-11-03      出版日期: 2012-02-26
: 

G350

 
引用本文:   
叶春蕾, 冷伏海. 科技文献全文主题识别方法实证研究[J]. 现代图书情报技术, 2012, 28(1): 53-57.
Ye Chunlei, Leng Fuhai. Theme Identification Empirical Study on Technical Documentation in Full-text. New Technology of Library and Information Service, 2012, 28(1): 53-57.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2012.01.09      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2012/V28/I1/53
[1] 靖继鹏, 马费成, 张向先. 情报科学理论[M]. 北京: 科学出版社, 2009: 231-236.

[2] 冷伏海, 吴霞. 基于文献的知识挖掘:概念、关键技术与应用[M].北京:国防工业出版社, 2008:271-306.

[3] 张晗, 崔雷. 生物信息学的共词分析研究[J]. 情报学报 , 2003, 22(5): 613-617.

[4] Kostoff R N, Miles D L, Eberhart H J. System and Method for Database Tomography: U.S., 5440481[P].1995-08-08.

[5] Kostoff R N,Eberhart H J,Toothman D R.Database Tomography for Information Retrieval[J].Journal of Information Science,1997,23(4):301-311.

[6] Kostoff R N, DeMarco R A. Science and Technology Text Mining: Analytical Chemistry[R]. Arlington: Office of Naval Research, 2003:10,20-22.

[7] Kostoff R N, Eberhart H J,Toothman D R,et al.Database Tomography for Technical Intelligence: Comparative Roadmaps of the Research Impact Assessment Literature and the Journal of the American Chemical Society[J].Scientometrics,1997,40(1):103-138.

[8] Kostoff R N, Shlesinger M F, Tshiteya R. Nonlinear Dynamics Text Mining Using Bibliometrics and Database Tomography[J]. International Journal of Bifurcation and Chaos,2004,14(1):61-92.

[9] Kostoff R N, Eberhart H J, Toothman D R. Hypersonic and Supersonic Flow Roadmaps Using Bibliometrics and Database Tomography[J].Journal of the American Society for Information Science,1999,50(5):427-447.

[10] Kostoff R N, Block J A. Context-dependent Conflation, Text Filtering and Clustering[R]. Arlington: Office of Naval Research, 2004:32-40.

[11] 冯璐, 冷伏海. 共词分析方法理论进展[J]. 中国图书馆学报 , 2006,32(2):88-92.

[12] 赵凡,马胜利.数据库内容结构分析法的理论与实践进展研究[J]. 情报理论与实践 ,2008,31(2): 279-282.

[13] 王立学, 冷伏海. 基于文本结构解析的动态共词方法研究[J]. 图书情报工作 , 2010, 54(24):37-40.

[14] Callon M, Law J, Rip A.Mapping the Dynamics of Science and Technology:Sociology of Science in the Real World[M].London: The Macmillan Press LTD, 1986:103-141.

[15] Callon M, Courtial J P, Laville F. Co-word Analysis as a Tool for Describing the Network of Interactions Between Basic and Technological Research: The Case of Polymer Chemistry[J]. Scientometrics, 1991,22(1):155-205.

[16] TerMine [EB/OL]. [2011-12-03]. http://www.nactem.ac.uk/software/termine/.

[17] TerMine Plugin for Protégé 4[EB/OL]. [2011-12-03]. http://www.co-ode.org/downloads/protege-x/plugins/termine-docs.pdf.

[18] Frantzi K T, Ananiadou S, Tsujii J. The C-value/NC-value Method of Automatic Recognition for Multi-word Terms[C]. In: Proceedings of the 2nd European Conference on Research and Advanced Technology for Digital Libraries. 1998: 585-604.

[19] National Aeronautics and Space Administration. 2011 NASA Strategic Plan [EB/OL]. [2011-08-05].http://www.nasa.gov/pdf/516579main_NASA2011StrategicPlan.pdf.
[1] 王红斌,王健雄,张亚飞,杨恒. 主题不平衡新闻文本数据集的主题识别方法研究*[J]. 数据分析与知识发现, 2021, 5(3): 109-120.
[2] 张金柱, 于文倩. 基于短语表示学习的主题识别及其表征词抽取方法研究[J]. 数据分析与知识发现, 2021, 5(2): 50-60.
[3] 邬金鸣,侯跃芳,崔雷. 基于医学主题词标引规则的词共现聚类分析结果自动判读和表达的研究[J]. 数据分析与知识发现, 2020, 4(9): 133-144.
[4] 丁晟春,俞沣洋,李真. 网络舆情潜在热点主题识别研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 29-38.
[5] 刘博文,白如江,周彦廷,王效岳. 基金项目数据和论文数据融合视角下科学研究前沿主题识别 *——以碳纳米管领域为例[J]. 数据分析与知识发现, 2019, 3(8): 114-122.
[6] 程齐凯,王佳敏,陆伟. 基于引用共词网络的领域基础词汇发现研究*[J]. 数据分析与知识发现, 2019, 3(6): 57-65.
[7] 徐路路, 王效岳, 白如江, 周彦廷. 基于DTM模型和文本特征分析的基金项目新兴趋势探测研究* ——以NSF石墨烯领域为例[J]. 数据分析与知识发现, 2018, 2(3): 87-97.
[8] 李真, 丁晟春, 王楠. 网络舆情观点主题识别研究*[J]. 数据分析与知识发现, 2017, 1(8): 18-30.
[9] 何远标, 乐小虬, 张帆. 学术论文大纲中关键术语抽取方法研究[J]. 现代图书情报技术, 2014, 30(3): 73-79.
[10] 赵宇翔,彭希羡. 媒体即社区?信息系统领域基于文献的研究主题分析*[J]. 现代图书情报技术, 2014, 30(1): 56-65.
[11] 胡昌平, 陈果. 共词分析中的词语贡献度特征选择研究[J]. 现代图书情报技术, 2013, 29(7/8): 89-93.
[12] 唐晓波, 肖璐. 融合关键词增补与领域本体的共词分析方法研究[J]. 现代图书情报技术, 2013, 29(11): 60-67.
[13] 谷俊. 专利文献中新技术术语识别研究[J]. 现代图书情报技术, 2012, (11): 53-59.
[14] 陆伟, 彭玉, 陈武. 基于SOM的领域热点主题探测[J]. 现代图书情报技术, 2011, 27(1): 63-68.
[15] 杨颖, 崔雷. 应用改进的共词聚类法探索医学信息学热点主题演变[J]. 现代图书情报技术, 2011, 27(1): 83-87.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn