Please wait a minute...
Advanced Search
现代图书情报技术  2013, Vol. 29 Issue (11): 46-51    DOI: 10.11925/infotech.1003-3513.2013.11.07
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
基于CMeSH语义系统的领域自由词-主题词语义映射研究
孙海霞, 李军莲, 李丹亚, 吴英杰, 李晓瑛
中国医学科学院医学信息研究所 北京 100020
The Study on Semantic Mapping from Free Word to Subject Headings Based on Semantic System of CMeSH
Sun Haixia, Li Junlian, Li Danya, Wu Yingjie, Li Xiaoying
Institute of Medical Information, Chinese Academy of Medical Sciences, Beijing 100020, China
全文: PDF(756 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 基于CMeSH的语义关系和生物医学词汇字长特点,设计文献自由词到CMeSH主题词语义自动映射方案,包括文献自由词与CMeSH主题词的语义相似度计算模型和“最佳”目标主题词识别方案,并以疾病类和微生物类词汇为例进行实验效果分析。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
孙海霞
李军莲
李丹亚
吴英杰
李晓瑛
关键词 中文医学主题词表词集合相似度语义相似度语义映射过滤规则    
Abstract:Based on semantic relationship of CMeSH and characteristics of biomedical vocabulary words, a semantic auto-mapping from literature keyword to subject headings is presented, including semantic similarity calculation model between literature keyword and subject headings of CMeSH, and the best subject heading identification scheme. Experimental results of disease and microbes vocabulary are analyzed.
Key wordsChinese Medical Subject Headings    Word set similarity    Semantic similarity    Semantic mapping    Filtering rules
收稿日期: 2013-08-15     
:  G250  
基金资助:本文系国家“十二五”科技支撑计划项目“面向外文科技文献的超级科技词表和本体建设”(项目编号:2011BAH10B01)和中国医学科学院医学信息研究所基本科研业务专项基金“基于CMeSH的中文生物医学文献文本概念映射研究”(项目编号:10R0115)的研究成果之一。
通讯作者: 孙海霞     E-mail: sun.haixia@imicams.ac.cn
引用本文:   
孙海霞, 李军莲, 李丹亚, 吴英杰, 李晓瑛. 基于CMeSH语义系统的领域自由词-主题词语义映射研究[J]. 现代图书情报技术, 2013, 29(11): 46-51.
Sun Haixia, Li Junlian, Li Danya, Wu Yingjie, Li Xiaoying. The Study on Semantic Mapping from Free Word to Subject Headings Based on Semantic System of CMeSH. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2013.11.07.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2013.11.07
[1] 张琪玉.分类语言、主题语言与自然语言一体化检索系统与《中国财经报刊数据库》的实践[J]. 现代图书情报技术,2002(1):66-68.(Zhang Qiyu.Retrieval System for Combination of Classification,Subject and Natural Languages and Practice of Database of Chinese Financial and Economic Publications[J]. New Technology of Library and Information Service,2002(1):66-68.)
[2] 章成志.一种基于语义体系的同义词识别研究[J]. 淮阴工学院学报,2004,13(1):59-62,67.(Zhang Chengzhi. Research on Synonyms Dictionary-based on Recognition of Synonyms [J].Journal of Huaiyin Institute of Technology,2004,13(1):59-62,67.)
[3] 刘华梅,侯汉清.基于情报检索的汉语同义词识别初探[J]. 情报理论与实践,2005,28(4):373-375. (Liu Huamei,Hou Hanqing.Preliminary Research on Recognition of Chinese Synonyms Based on Information Retrieval[J]. Information Studies: Theory & Application, 2005,28(4):373-375.)
[4] 杜慧平,仲云云.自然语言叙词表自动构建研究[M].南京:东南大学出版社,2009.(Du Huiping, Zhong Yunyun. Research on Automatic Construction of Natural Language Thesaurus[M]. Nanjing: Southeast University Press,2009.)
[5] 陆勇,侯汉清.基于PageRank算法的汉语同义词自动识别[J]. 西华大学学报:自然科学版,2008,27(2):13-15, 94. (Lu Yong, Hou Hanqing. Research on Recognition of Chinese Synonyms Based on PageRank [J].Journal of Xihua University: Natural Science Edition, 2008,27(2):13-15, 94.)
[6] 曹晶.同义词挖掘及其在概念信息检索系统中的应用研究[D].长春:东北师范大学,2006.(Cao Jing. Synonyms Recognition and Application Research in Concept-based Information Retrieval System [D].Changchun: Northeast Normal University, 2006.)
[7] Semantic Similarity Measures in MeSH Ontology and Their Application to Information Retrieval on Medline.[2013-06-15].http://www.intelligence.tuc.gr/publications/Hliautakis.pdf.
[8] Raftopoulou P,Petrakis E.Semantic Similarity Measures: A Comparison Study[R]. TR-TUC-ISL-04-2005.2005.
[9] 宋明亮.汉语词汇字面相似性原理与后控制词表动态维护研究[J]. 情报学报,1996,15(4):261-271. (Song Mingliang. Research on Principle of Literal Similarity Among Chinese Words and Maintaining Post-controlled Vocabulary [J].Journal of the China Society for Scientific and Technical Information,1996,15(4):261-271.)
[10] 刘群,李素建.基于《知网》的词汇语义相似度计算[C].见: 第三届汉语词汇语义学研讨会.2002:59-76. (Liu Qun, Li Sujian. Word Semantic Similarity Computation Based on HowNet [C]. In: Proceedings of the 3rd Chinese Lexical Semantics Workshop.2002:59-76.)
[11] Banerjee S, Pedersen T. Extended Gloss Overlap as Measure of Semantic Ralatedness [C].In: Proceedings of the 18th International Joint Conference on Artificial Intelligence. San Francisco, CA, USA: Morgan Kaufmann Publishers Inc.,2003:805-810.
[12] 陆勇,侯汉清.基于词典注释的汉语同义词自动识别[C].见: 第一届全国信息检索与内容安全学术会议.2004:339-348.(Lu Yong, Hou Hanqing. Automatic Recognition of Chinese Synonyms Based on Definition in Dictionary[C]. In: Proceedings of the 1st National Information Retrieval and Content Security Conference.2004:339-348.
[13] 荀恩东,颜伟.基于语义网计算英语词语相似度[J]. 情报学报,2006,25(1):43-48.(Xun Endong, Yan Wei. English Word Similarity Calculation Based on Semantic Net [J]. Journal of the China Society for Scientific and Technical Information,2006,25(1):43-48.)
[14] CMeSH[DB/OL]. [2013-06-20].http://cmesh.imicams.ac.cn/index.action?action=index.
[15] MeSH[DB/OL].[2013-06-20]. http://www.nlm.nih.gov/mesh/MBrowser.html.
[16] CMeSH[EB/OL].[2013-06-20]. http://cmesh.imicams.ac.cn/index.action?action=mainWordView&keyid=D018410&bea nName=com. tbs.dictweb.bean.ZtcKmcPage.
[17] SinoMed[DB/OL]. [2013-06-20].http://www.sinomed.ac.cn/zh/subjectSearch.do?method=detail&dbtype=zh&id=D018 410&flag=110.
[18] 周瑛.信息检索中文本相似度的研究[J]. 情报理论与实践,2005,28(2):142-144.(Zhou Ying. Study on Chinese Text Similarity of Information Retrieval [J]. Information Studies: Theory & Application, 2005,28(2):142-144.)
[19] 秦春秀,赵捧未,刘怀亮.词语相似度计算研究[J]. 情报理论与实践,2007,30(1):105-108.(Qin Chunxiu, Zhao Pengwei, Liu Huailiang. Study on Word Similarity[J]. Information Studies: Theory & Application, 2007,30(1):105-108.)
[20] 孙海霞,成颖.信息集成中的字符串匹配技术研究[J]. 现代图书情报技术,2007(5):22-26.(Sun Haixia, Cheng Ying. Study on String-based Matching of Information Integration [J].New Technology of Library and Information Service,2007(5):22-26.)
[21] Shvaiko P, Euzenat J. A Survey of Schema-based Matching Approaches[J]. Journal on Data Semantics IV,2005:146-171.
[1] 陈二静,姜恩波. 文本相似度计算方法研究综述[J]. 数据分析与知识发现, 2017, 1(6): 1-11.
[2] 翟东升,蔡文浩,张杰,李振飞. 改进的中文商标语义相似度计算方法研究[J]. 数据分析与知识发现, 2017, 1(11): 19-28.
[3] 刘健,毕强,刘庆旭,王福. 数字文献资源内容服务推荐研究*——基于本体规则推理和语义相似度计算[J]. 现代图书情报技术, 2016, 32(9): 70-77.
[4] 巴志超,李纲,朱世伟. 基于语义网络的研究兴趣相似性度量方法*[J]. 现代图书情报技术, 2016, 32(4): 81-90.
[5] 毕强, 刘健, 鲍玉来. 基于语义相似度的文本聚类研究*[J]. 数据分析与知识发现, 2016, 32(12): 9-16.
[6] 刘怀亮, 杜坤, 秦春秀. 基于知网语义相似度的中文文本分类研究[J]. 现代图书情报技术, 2015, 31(2): 39-45.
[7] 范雪雪, 王志荣, 徐晤, 梁银, 马小虎. 基于医学本体的术语相似度算法研究[J]. 现代图书情报技术, 2015, 31(12): 57-64.
[8] 王思丽, 祝忠明, 姚晓娜. 机构知识库语义知识获取方法分析及实验研究[J]. 现代图书情报技术, 2014, 30(4): 7-13.
[9] 胡吉明, 肖璐. 向量空间模型文本建模的语义增量化改进研究[J]. 现代图书情报技术, 2014, 30(10): 49-55.
[10] 何超, 张玉峰. 融合语义相似度的商务情报链接分析算法研究[J]. 现代图书情报技术, 2013, 29(3): 27-32.
[11] 马军红. 分阶段融合的文本语义相似度计算方法[J]. 现代图书情报技术, 2013, 29(10): 20-26.
[12] 王莉. 基于关键词链的动态分面研究[J]. 现代图书情报技术, 2012, 28(7): 76-81.
[13] 邢美凤. 科技文献关键词冗余解决方案研究[J]. 现代图书情报技术, 2012, 28(1): 34-39.
[14] 徐健 张智雄 肖卓 邓昭俊. 科技术语语义相似度计算方法研究综述[J]. 现代图书情报技术, 2010, 26(7/8): 51-57.
[15] 孙海霞 钱庆 吴英杰 李军莲. MeSH词表的语义相似度计算研究*[J]. 现代图书情报技术, 2010, 26(6): 12-16.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn