Please wait a minute...
Advanced Search
现代图书情报技术  2008, Vol. 24 Issue (8): 70-75     https://doi.org/10.11925/infotech.1003-3513.2008.08.12
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
文献数据库中书目信息共现挖掘系统的开发*
崔雷 刘伟 闫雷 张晗 侯跃芳 黄莹娜 张浩
(中国医科大学信息管理与信息系统(医学)系   沈阳 110001)
Development of a Text Mining System Based on the Co-occurrence of Bibliographic Items in Literature Databases
Cui Lei   Liu Wei   Yan Lei   Zhang Han  Hou Yuefang  Huang Yingna  Zhang Hao
(Department of Information Management and Information System (Medicine), China Medical University, Shenyang  110001,China)
全文: PDF (999 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

针对权威的生物医学数据库和引文索引数据,介绍一个基于文献数据库中书目信息共现关系进行文本挖掘的系统。该系统具有基本的文献计量学分析功能,并对相应的结果进行可视化表达;对高频主题词、高产作者和高被引论文和高被引作者进行共现分析,据此进行聚类分析和关联分析,获得有关的研究主题聚类和主题词/副主题词关联规则、合著聚类分析、高被引论文同被引聚类分析和高被引作者同被引聚类分析的结果和可视化表达。其中对关联规则的分析可以发现主题词之间的潜在语义规则,其他的文献计量学指标和共现分析结果可以用于科学计量学的分析。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
侯跃芳
张晗
黄莹娜
张浩
崔雷
刘伟
闫雷
关键词 文本挖掘共现分析书目信息科学计量学    
Abstract

This paper presents a text mining system based on the co-occurrence of bibliographic items in literature databases. This system produces the principal bibliometric indicators of a given document set oriented to PubMed and Web of Science, and some of results are presented by visualization techniques. Further more, it provides cluster analysis and association analysis by investigating the co-occurrence data of high-frequent MeSH terms, high-productive authors, highly-cited papers and highly-cited authors. Using these approaches users can mining the potential association rules among MeSH terms, and engage scientometric investigations.

Key wordsText Mining    Co-occurrence    Bibliographic System    Scientometrics
收稿日期: 2008-03-19      出版日期: 2008-08-25
: 

G254

 
基金资助:

*本文系国家自然科学基金项目“运用文本数据库中元数据关联规则进行知识发现的研究”(项目编号:70473101)的研究成果之一。

通讯作者: 崔雷     E-mail: lcui@mail.cmu.edu.cn
作者简介: 崔雷,刘伟,闫雷,张晗,侯跃芳,黄莹娜,张浩
引用本文:   
崔雷,刘伟,闫雷,张晗,侯跃芳,黄莹娜,张浩. 文献数据库中书目信息共现挖掘系统的开发*[J]. 现代图书情报技术, 2008, 24(8): 70-75.
Cui Lei, Liu Wei,Yan Lei,Zhang Han,Hou Yuefang,Huang Yingna,Zhang Hao. Development of a Text Mining System Based on the Co-occurrence of Bibliographic Items in Literature Databases. New Technology of Library and Information Service, 2008, 24(8): 70-75.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2008.08.12      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2008/V24/I8/70

[1] Ding J, Berleant D.  MedKit:A Helper Toolkit for Automatic Mining of MEDLINE/PubMed Citations[J]. Bioinformatics, 2005,21(5):694-695.
[2] 张晗, 任志国, 张健, 等. 基于主题词关联规则的医学文本数据库数据挖掘的尝试[J]. 医学信息学杂志, 2008(1):32-35.
[3] 张晗, 王晓瑜, 崔雷. 共词分析法与文献被引次数结合研究专题领域的发展态势[J]. 情报理论与实践, 2007,30(3):378-380.
[4] 张晗, 刘鹏年, 崔雷. 国外消化性溃疡文献研究热点的分析[J]. 世界华人消化杂志,2007,15(10):1150-1155.
[5] 李范, 王飞, 侯跃芳, 等. 病案相关研究的文献计量学分析[J]. 中华医学图书情报杂志,2007,16 (3):70-72.

[1] 黄名选,蒋曹清,卢守东. 基于词嵌入与扩展词交集的查询扩展*[J]. 数据分析与知识发现, 2021, 5(6): 115-125.
[2] 许光,任明,宋城宇. 西方媒体新闻中的中国经济形象提取*[J]. 数据分析与知识发现, 2021, 5(5): 30-40.
[3] 代冰,胡正银. 基于文献的知识发现新近研究综述 *[J]. 数据分析与知识发现, 2021, 5(4): 1-12.
[4] 余传明, 王曼怡, 林虹君, 朱星宇, 黄婷婷, 安璐. 基于深度学习的词汇表示模型对比研究*[J]. 数据分析与知识发现, 2020, 4(8): 28-40.
[5] 夏天. 面向中文学术文本的单文档关键短语抽取 *[J]. 数据分析与知识发现, 2020, 4(7): 76-86.
[6] 马建霞,袁慧,蒋翔. 基于Bi-LSTM+CRF的科学文献中生态治理技术相关命名实体抽取研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 78-88.
[7] 杜建. 医学知识不确定性测度的进展与展望*[J]. 数据分析与知识发现, 2020, 4(10): 14-27.
[8] 关鹏,王曰芬. 国内外专利网络研究进展*[J]. 数据分析与知识发现, 2020, 4(1): 26-39.
[9] 黄名选,卢守东,徐辉. 基于加权关联模式挖掘与规则后件扩展的跨语言信息检索 *[J]. 数据分析与知识发现, 2019, 3(9): 77-87.
[10] 杨亚楠,赵文辉,张健,谭珅,张贝贝. 基于多视图协同的政策文本可视化研究*[J]. 数据分析与知识发现, 2019, 3(6): 30-41.
[11] 张梦吉,杜婉钰,郑楠. 引入新闻短文本的个股走势预测模型[J]. 数据分析与知识发现, 2019, 3(5): 11-18.
[12] 张宁, 尹乐民, 何立峰. 网络股评“发布者-关注者”BSI与股票市场关联性研究*[J]. 数据分析与知识发现, 2018, 2(6): 1-12.
[13] 范馨月, 崔雷. 基于文本挖掘的药物副作用知识发现研究[J]. 数据分析与知识发现, 2018, 2(3): 79-86.
[14] 汪强兵, 章成志. 融合内容与用户手势行为的用户画像构建系统设计与实现*[J]. 数据分析与知识发现, 2017, 1(2): 80-86.
[15] 谢秀芳, 张晓林. 针对科技路线图的文本挖掘研究: 集成分析及可视化*[J]. 数据分析与知识发现, 2017, 1(1): 16-25.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn