Please wait a minute...
Advanced Search
现代图书情报技术  2014, Vol. 30 Issue (12): 92-96
  应用实践 本期目录 | 过刊浏览 | 高级检索 |
夏冬1, 肖晓旦1, 李国垒1, 陈先来1,2
1. 中南大学湘雅医学院 长沙 410013;
2. 医学信息研究湖南省普通高等学校重点实验室(中南大学) 长沙 410013
Research on Correspondence Between Keyword and Chinese Library Classification Based on Latent Semantic Analysis
Xia Dong1, Xiao Xiaodan1, Li Guolei1, Chen Xianlai1,2
1. Xiangya School of Medicine, Central South University, Changsha 410013 China;
2. Key Laboratory of Medical Information Research, Central South University, Changsha 410013, China
全文: PDF (396 KB)   HTML  
输出: BibTeX | EndNote (RIS)      

[目的]通过探索关键词-分类号的对应关系, 为对照系统的建立打下基础.[应用背景]辅助不熟悉分类号的论文作者进行论文标引, 同时协助用户结合关键词和分类号完成更精确的检索.[方法]对构建的关键词-分类号矩阵进行奇异值分解, 得到关键词、分类号的三维语义坐标, 再根据查询提问式的向量表示与分类号坐标进行相关度计算并降序排序.[结果]相比单个、三个及三个以上关键词, 两个关键词与分类号的对应关系有较好效果.在100对包含两个关键词的词组中, 有91对能够确定至少一个相关的分类号, 准确率达到91%.[结论]两个关键词与分类号的对应关系结果较为理想, 为构建对照系统打下良好基础.

E-mail Alert
关键词 潜在语义分析关键词分类号对应关系    

[Objective] This paper attempts to explore the relationship between keyword and Chinese Library Classification for building a foundation for the comparison system. [Context] To help the authors unfamiliar with CLC make indexing and to assist users to complete more precise retrieval through combining keywords with related CLC. [Methods] Through decompositing constructed Keywords-CLC matrix with SVD (Singular Value Decom­position), A three-dimensional semantic coordinates between keywords and CLC is obtained. Then, according to vector representation of a query and the CLC coordinates, the correspondence is calculated and sorted in descending order. [Results] Comparing with single, three or more keywords, the correspondence accuracy between two keywords and CLC achieved better results. Among 100 phrases containing two keywords, 91 phrases are able to determine at least one associated CLC, the accuracy rate reaches 91%. [Conclusions] The correspondence effect between the phrases of two key words and single CLC is positive and lays a good foundation for the construction of the comparison system.

Key wordsLatent semantic analysis    Keyword    Chinese Library Classification    Correspondence relation
收稿日期: 2014-07-03      出版日期: 2015-01-20
:  G254  

本文系国家社会科学基金项目"面向临床决策的电子病历潜在语义分析及应用研究"(项目编号:13BTQ052)和中南大学中央高校基本科研业务费专项资金项目"电子病历中临床术语的潜在语义分析及其应用研究"(项目编号: 2013zzts265)的研究成果之一.

通讯作者: 陈先来 E-mail:     E-mail:
作者简介: 作者贡献声明: 夏冬, 肖晓旦, 陈先来: 提出研究思路, 设计研究方案; 李国垒, 夏冬: 进行实验; 夏冬: 采集、分析数据, 起草论文; 陈先来: 最终版本修订.
夏冬, 肖晓旦, 李国垒, 陈先来. 基于潜在语义分析的关键词-分类号对应关系研究[J]. 现代图书情报技术, 2014, 30(12): 92-96.
Xia Dong, Xiao Xiaodan, Li Guolei, Chen Xianlai. Research on Correspondence Between Keyword and Chinese Library Classification Based on Latent Semantic Analysis. New Technology of Library and Information Service, 2014, 30(12): 92-96.
链接本文:      或

[1] 钟伟, 马骏, 边莉, 等. 医学科研论文中图分类号标引的探讨 [J]. 中国医疗前沿, 2009, 4(19): 122-123. (Zhong Wei, Ma Jun, Bian Li, et al. Indexing of CLC Number in Medical Papers [J]. China Healthcare Innovation, 2009, 4(19): 122-123.)
[2] 吴锦雅, 陈望忠, 王征爱. 关于中图分类号在科技期刊论文中应用的商榷[J]. 编辑学报, 2008, 20(6): 549-550. (Wu Jinya, Chen Wangzhong, Wang Zheng'ai. On Application of Chinese Book Classification Number in Sci-tech Papers [J]. Acta Editologica, 2008, 20(6): 549-550.)
[3] 张晓丽. 科技论文中图分类号标引现状分析及规范化建议[J]. 科技与出版, 2012(9): 120-121. (Zhang Xiaoli. CLC Indexing Status Analysis of Scientific Papers and Standardized Proposal [J]. Science Technology and Publication, 2012(9): 120-121.)
[4] 杨贺, 杨奕虹, 李宁. 关键词-分类号关联词表构建[J].现代图书情报技术, 2013(7-8): 107-113. (Yang He, Yang Yihong, Li Ning. Construction of Keywords-Chinese Library Classification Codes Integrated Thesaurus [J]. New Technology of Library and Information Service, 2013(7-8): 107-113.)
[5] 陈先来, 肖晓旦, 杜方冬. 基于互信息构建关键词-叙词对照表的研究[J]. 情报理论与实践, 2006, 29(5): 567-569. (Chen Xianlai, Xiao Xiaodan, Du Fangdong. Research on Keyword-Descriptor Comparison Table Construction Based on Mutual Information [J]. Information Studies: Theory & Application, 2006, 29(5): 567-569.)
[6] 朱伟丽, 韩宇, 肖晓旦, 等. 医学关键词与叙词对照表自动构建研究[J]. 现代图书情报技术, 2006(8): 51-54. (Zhu Weili, Han Yu, Xiao Xiaodan. Study of Automatic Construction of Medicine Keyword-Descriptor Comparison List [J]. New Technology of Library and Information Service, 2006(8): 51-54.)
[7] 李国垒, 陈先来. 潜在语义分析在关键词-叙词对照系统构建中的应用[J]. 情报理论与实践, 2014, 37(4): 127-133. (Li Guolei, Chen Xianlai. The Application of Latent Semantic Analysis to Construction of Keyword-Descriptor Comparison System [J]. Information Studies: Theory & Application, 2014, 37(4): 127-133.)
[8] 钟伟金. 基于共现模式的分类号-关键词对应关系研究[J]. 情报理论与实践, 2013, 36(5): 116-119. (Zhong Weijin. Research on CLC-Keyword Corresponding Relationship Based on Co-occurrence Patterns [J]. Information Studies: Theory & Application, 2013, 36(5): 116-119.)
[9] 中国生物医学文献服务系统 [DB/OL]. [2014-03-27]. http:// (SinoMed [DB/OL]. [2014-03-27]. http://
[10] 杨翠. 潜在语义分析理论及其在文本检索与聚类中的应用研究 [D]. 上海: 上海大学, 2008. (Yang Cui. Latent Semantic Analysis Theory and Its Application in Text Retrieval and Clustering [D]. Shanghai: Shanghai University, 2008.)
[11] 何志林, 王春红. 矩阵奇异值分解在隐含语义信息检索中的应用[J]. 现代计算机:下半月版, 2011(6): 21-23. (He Zhilin, Wang Chunhong. Application of Matrix Singular Value Decomposition (SVD) in Latent Semantic Information Retrieval [J]. Modern Computer, 2011(6): 21-23.)

[1] 文秀贤,徐健. 基于用户评论的商品特征提取及特征价格研究 *[J]. 数据分析与知识发现, 2019, 3(7): 42-51.
[2] 曾庆田,胡晓慧,李超. 融合主题词嵌入和网络结构分析的主题关键词提取方法 *[J]. 数据分析与知识发现, 2019, 3(7): 52-60.
[3] 张震,曾金. 面向用户评论的关键词抽取研究*——以美团为例[J]. 数据分析与知识发现, 2019, 3(3): 36-44.
[4] 李钰曼,陈志泊,许福. 基于KACC模型的文本分类研究 *[J]. 数据分析与知识发现, 2019, 3(10): 89-97.
[5] 田世海, 吕德丽. 改进潜在语义分析和支持向量机算法用于突发安全事件舆情预警*[J]. 数据分析与知识发现, 2017, 1(2): 11-18.
[6] 赵夷平,毕强. 关联数据在学术资源网相似文献发现中的应用研究*[J]. 现代图书情报技术, 2016, 32(3): 41-49.
[7] 李国垒, 陈先来, 夏冬, 杨荣. 面向临床决策的电子病历文本潜在语义分析*[J]. 数据分析与知识发现, 2016, 32(3): 50-57.
[8] 王培霞,余海,陈力,王永吉. 科技查新中检索词智能抽取系统的设计与实现*[J]. 现代图书情报技术, 2016, 32(11): 82-93.
[9] 许德山, 李辉, 张运良. 文献关键词链接标引方法研究[J]. 现代图书情报技术, 2015, 31(9): 31-37.
[10] 吴妮, 赵捧未, 秦春秀. 基于语义分析和相似强度的微博热点发现方法[J]. 现代图书情报技术, 2015, 31(5): 57-64.
[11] 李军锋, 吕学强, 周绍钧. 带权复杂图模型的专利关键词标引研究[J]. 现代图书情报技术, 2015, 31(3): 26-32.
[12] 李湘东, 曹环, 丁丛, 黄莉. 利用《知网》和领域关键词集扩展方法的短文本分类研究[J]. 现代图书情报技术, 2015, 31(2): 31-38.
[13] 张颖怡, 章成志, 池雪花, 李蕾. 科研用户博文关键词标注行为差异研究——以科学网博客为例[J]. 现代图书情报技术, 2015, 31(10): 13-21.
[14] 夏天. 词语位置加权TextRank的关键词抽取研究[J]. 现代图书情报技术, 2013, 29(9): 30-34.
[15] 王昊, 邹杰利, 邓三鸿. 面向中文图书的自动标引模型构建及实验分析[J]. 现代图书情报技术, 2013, 29(7/8): 55-62.
Full text



版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190