Please wait a minute...
Advanced Search
现代图书情报技术  2014, Vol. 30 Issue (7): 17-23     https://doi.org/10.11925/infotech.1003-3513.2014.07.03
  数字图书馆 本期目录 | 过刊浏览 | 高级检索 |
中图法与DDC类目自动映射研究
张爱民1, 贾君枝2, 郝倩倩3
1. 山西职业技术学院计算机工程系, 太原030006;
2. 山西大学经济与管理学院, 太原030006;
3. 永城市实验高级中学, 永城476600
The Study on Automatic Mapping of Category Between Chinese Library Classification and DDC
Zhang Aimin1, Jia Junzhiz2, Hao Qianqian3
1. Computer Engineering Department, Shanxi Polytechnic College, Taiyuan 030006, China;
2. School of Economics and Management, Shanxi University, Taiyuan 030006, China;
3. Yong Cheng City Experimental Senior High School, Yongcheng 476600, China
全文: PDF (432 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

[目的]研究中图法与DDC类目自动映射的问题,通过实现两者的互操作以达到集成检索、浏览和下载跨语言、跨地区的信息资源的目的。[方法]基于人工匹配映射的数据,研究基于特征集、类目匹配规则、类目关系、书目记录的语义匹配算法。[结果]实验证明,将近80%的类目与人工映射结果的数据相同,一定程度上提高了自动映射的准确性。[局限]仅基于人工映射经验提出基于特征同集的类目相似度计算,尚未实现语义层面的精确计算。实验数据局限在理学类目领域,未对其他领域的类目特征详细研究。[结论]综合考虑类目的含义受类名、类目注释、主题同、上下位关系等多种因素影响而提出的自动映射算法,相比当前主要考虑单一方面的要素而言,具有客观性和全面性。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
郝倩倩
张爱民
贾君枝
Abstract

[Objective] Study the problems of automatic mapping aiming to realize integrated retrieval, browsing,downloading information cross regions and language through classification inter operation.[Methods] Discuss semantic similarity algorithm considering characteristic sets, category matching rules and semantic relation based on artificial mapping data.[Results] Prove that 80% categories are the same as the results of artificial mapping in the experiment.[Limitations] The similarity of categories based on characteristic sets, is short of matching of semantic operation. Alsois only in the field of science, it is necessary to apply in other fields in the future.[Conclusions] The algorithm is considering comprehensively category names, notations, subject vocabularies, and semantic relations which define connotation and denotation of concepts, comparing to the existing limitation of relying solely on the category names matching method.

Key wordsChinese Library Classification    DDC    Category matching    Automatic mapping
收稿日期: 2014-03-21      出版日期: 2014-10-20
:  G254.1  
基金资助:

山西省回国留学人员科研资助项目“开放获取期刊的学术影响力评估“(项目编号:1105907)的研究成果之一

通讯作者: 贾君枝E-mail:junzhij@163.com     E-mail: junzhij@163.com
作者简介: 作者贡献声明:张爱民:设计研究方案,进行算法实验;贾君枝:提出研究思路,修改、修定论文;赤吕倩倩:起草论文。
引用本文:   
张爱民, 贾君枝, 郝倩倩. 中图法与DDC类目自动映射研究[J]. 现代图书情报技术, 2014, 30(7): 17-23.
Zhang Aimin, Jia Junzhiz, Hao Qianqian. The Study on Automatic Mapping of Category Between Chinese Library Classification and DDC. New Technology of Library and Information Service, 2014, 30(7): 17-23.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2014.07.03      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2014/V30/I7/17

[1] U.S. National Library of Medicine. Unified Medical Language System[EB/OL].[2013-03-15]. http://www.nlm. nih.gov/research/umls/.
[2] Information Society Directorate-General of the European Commission. Metadata Renardus[EB/OL].[2013-03-15]. http://www.ukoln.ac.uk/metadata/renardus/.
[3] 戴剑波, 侯汉清. 图书分类法映射系统设计原理——以《中国图书馆分类法》和《杜威十进分类法》为例[J]. 情报学报, 2005, 24(3): 299-303. (Dai Jianbo, Hou Hanqing. Principle of the Automatic Mapping System of Library Classifications——Take CLC and DDC as the Example[J]. Journal of the China Society for Scientific and Technical Information, 2005, 24(3): 299-303.)
[4] 周林志, 齐建东, 王建新, 等. 基于词汇相似度的IPC与CLC映射[J]. 计算机工程, 2010, 36(23): 274-276, 279. (Zhou Linzhi, Qi Jiandong, Wang Jianxin, et al. Mapping Between IPC and CLC Based on Similarity of Words[J]. Computer Engineering, 2010, 36(23): 274-276, 279.)
[5] 贾君枝, 郝倩倩. DDC到《中图法》类目映射方法研究[J]. 中国图书馆学报, 2013, 39(1): 43-50. (Jia Junzhi, Hao Qianqian. The Study of Ways of Mapping Between Chinese Library Classification and DDC[J]. Journal of Library Science in China, 2013, 39(1): 43-50.)
[6] 顾益军, 樊孝忠, 王建华, 等. 中文停用词表的自动选取[J]. 北京理工大学学报, 2005, 25(4): 337-340. (Gu YijuFan Xiaozhong, Wang Jianhua, et al. Automatic Selection of Chinese Stoplist[J]. Transactions of Beijing Institute of Technology, 2005, 25(4): 337-340.)
[7] 贾君枝, 郝倩倩. DDC与《中图法》组合类目映射探讨[J]. 中国图书馆学报, 2012, 38(4): 63-70. (Jia Junzhi, Hao Qianqian. Mapping of Combined Category between Chinese Library Classification and DDC[J]. Journal of Library Science in China, 2012, 38(4): 63-70.)
[8] 中国科学院计算技术研究所. ICTCLAS汉语分词系统[CP/OL].[2013-01-28]. http://ictclas.org/. (Institute of Computing Technology, Chinese Academy of Sciences. ICTCLAS Chinese Word Segmentation System[CP/OL].[2013-01-28]. http://ictclas.org/.)

[1] 余本功,曹雨蒙,陈杨楠,杨颖. 基于nLD-SVM-RF的短文本分类研究*[J]. 数据分析与知识发现, 2020, 4(1): 111-120.
[2] 张云中. 利用形式概念分析构建Folksonomy用户行为知识发现模型[J]. 现代图书情报技术, 2012, 28(7): 66-75.
[3] 张云中, 杨萌, 徐宝祥. 基于FCA的Folksonomy用户偏好挖掘研究[J]. 现代图书情报技术, 2011, 27(6): 72-78.
[4] 汪勇,何显红. 基于Web的通用汉语著者号码查询系统的设计与实现[J]. 现代图书情报技术, 2009, 25(11): 78-81.
[5] 王翠英(编译). 标签的聚类分析研究[J]. 现代图书情报技术, 2008, 24(5): 67-71.
[6] 李华. 汉语著者号自动生成系统的设计与实现[J]. 现代图书情报技术, 2007, 2(12): 82-85.
[7] 何跃兵 . 通用汉语著者号自动生成系统[J]. 现代图书情报技术, 2006, 1(5): 81-85.
[8] 周荣庭, 郑彬(编译) . 分众分类:网络时代的新型信息分类法(编译)[J]. 数据分析与知识发现, 2006, 22(3): 72-75.
[9] 应伟,王正欧,安金龙. 种基于改进的支持向量机的两类文本分类方法的研究*[J]. 现代图书情报技术, 2005, 21(12): 44-47.
[10] 侯三军,王正兴. 书目数据合并方法探讨[J]. 现代图书情报技术, 2002, 18(4): 73-75.
[11] 陈树年. 网络信息分类法研究[J]. 现代图书情报技术, 2002, 18(3): 54-57.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn