Please wait a minute...
Advanced Search
现代图书情报技术  2006, Vol. 1 Issue (9): 23-28     https://doi.org/10.11925/infotech.1003-3513.2006.09.06
  信息检索技术 本期目录 | 过刊浏览 | 高级检索 |
基于多语境的相关词自动提取系统的设计与实现
章成志 苏兰芳 苏新宁
(南京大学信息管理系 南京 210093)
Design and Implementation of Automatic Extraction Relevance Terms System Based on Multi-context
Zhang Chengzhi    Su Lanfang    Su Xinning
 (Department of Information Management, Nanjing University, Nanjing 210093, China)
全文:
输出: BibTeX | EndNote (RIS)      
摘要 

利用语料库、释义词典、用户检索日志作为识别相关词的语境,设计并实现相关词自动提取系统。实验结果表明,虽然面向相同的基本词汇集合,但是基于不同语境提取的相关词之间的重复率很低,各个结果间的互补性很强,说明结果整合非常有必要。在本系统中,通过直接整合途径构建最后的相关词词表。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
章成志
苏新宁
苏兰芳
关键词 相关词多语境语料释义词典用户日志    
Abstract

This paper chooses corpus, definitions dictionaries and users’ query logs as contexts to extract the relevance terms. The experiment results show that the overlap ratio of results in different contexts is very low. So, it is necessary to integrate the different results. All of the relevance terms are integrated to a relevance table through direct integration.

Key wordsRelevance term    Multi-context    Corpus    Definitions dictionary    Query log
收稿日期: 2006-06-05      出版日期: 2006-09-25
: 

TP391 

 
     
  G252

 
通讯作者: 章成志     E-mail: zcz51@citiz.net
作者简介: 章成志,苏兰芳,苏新宁
引用本文:   
章成志,苏兰芳,苏新宁 . 基于多语境的相关词自动提取系统的设计与实现[J]. 现代图书情报技术, 2006, 1(9): 23-28.
Zhang Chengzhi,Su Lanfang,Su Xinning . Design and Implementation of Automatic Extraction Relevance Terms System Based on Multi-context. New Technology of Library and Information Service, 2006, 1(9): 23-28.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2006.09.06      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2006/V1/I9/23

1贺宏朝等.一种基于上下文的中文信息检索查询扩展.中文信息学报,16(6):32-37
2Voorhees,E. M..Query expansion using lexical semantic relations.Proceedings of  the 17th Annual International ACM-SIGIR Conference on Research and Development in Information Retrieval,Dublin, Ireland.1994.61-69
3Yufeng Jing,W. B. Croft.An Association Thesaurus for Information Retrieval.Technical Report: UM-CS-1994-017.University of Massachusetts.1994
4Crouch C.A Cluster-based approach to thesaurus construction.Proceedings of the 11th Annual International ACM-SIGIR Conference on Research & Development in Information Retrieval,Grenoble,ACM Press,1988.309-320
5Crouch,C, Yang,B.Experiments in Automatic Statistical Thesaurus Construction. Proceedings of the 15th Annual International ACM-SIGIR Conference on Research & Development in Information Retrieval,Copenhagen, Denmark, ACM Press, 1992.77-88
6Hsinchun Chen,Kevin J ,Lynch.Automatic construction of networks of concepts characterizing document databases.IEEE Transactions on Systems,1992,22(5):885-902
7Peter D. Tumey.Mining the Web for synonyms: PMI-IR versus LSA on TOEFL.Proceedings of the 12th European Conference on Machine Learning.Freiburg, Germany.2001.491-502
8Pierre P. Senellart, Vincent D. Blondel, Automatic discovery of similar words, chapter in: Survey of Text Mining, Springer-Verlag, 2003
9Masaki Murata, Toshiyuki Kanamaru, Hitoshi Isahara.Automatic synonym acquisition based on matching of definition sentences in multiple dictionaries.CICLing 2005,LNCS 3406.2005:293-304
10崔航,文继荣,李敏强.基于用户日志的查询扩展统计模型.软件学报,2003,14(9):1593-1599
11Hsiao-Tieh Pu,Lee-Feng Chien.Integrating Log-Based and Text-Based Methods Towards Automatic Web Thesaurus Construction.Proceedings of the American Society for Information Science and Technology.2004,41(1):463-471
12周全明.全文检索系统后控制技术研究:[学位论文].北京:空间政治学院,1995
13朱毅华,侯汉清,沙印亭.计算机识别汉语同义词的两种算法比较和测评.中国图书馆学报,2002,28(4):82-85
14http://ccl.pku.edu.cn/doubtfire/Course/Chinese%20Information%20Processing/Source_Code/Chapter_8/Lexicon_full_2000.zip(Accessed Apr.20,2006)
15罗盛芬,孙茂松.基于字串内部结合紧密度的汉语自动抽词实验研究.中文信息学报,2003,17(3):9-14
16G.Salon, M.J.Mcgill. Introduction to Modern Information Retrieval. NewYork:McGraw-Hill Book Co.,  1983
17王益,白钦先.当代金融辞典.北京:中国经济出版社,2000
18Baidu.http://www.baidu.com (Accessed Apr.20,2006)
19天网.http://e.pku.edu.cn (Accessed Apr.20,2006)

[1] 刘文斌, 何彦青, 吴振峰, 董诚. 基于BERT和多相似度融合的句子对齐方法研究*[J]. 数据分析与知识发现, 2021, 5(7): 48-58.
[2] 梁继文,江川,王东波. 基于多特征融合的先秦典籍汉英句子对齐研究*[J]. 数据分析与知识发现, 2020, 4(9): 123-132.
[3] 高永兵, 杨贵朋, 张娣, 马占飞. 基于突显词博文聚类的官微事件检测方法*[J]. 数据分析与知识发现, 2017, 1(9): 57-64.
[4] 邵健, 章成志. 从互联网上自动获取领域平行语料[J]. 现代图书情报技术, 2014, 30(12): 36-43.
[5] 关晓炟,吕学强,李卓,郑略省,. 用户查询日志中的中文机构名识别*[J]. 现代图书情报技术, 2014, 30(1): 72-78.
[6] 汤亚芬. 先秦古汉语典籍中的人名自动识别研究[J]. 现代图书情报技术, 2013, 29(7/8): 63-68.
[7] 熊文新. 英汉环保领域平行语料的句对齐与再对齐[J]. 现代图书情报技术, 2013, (6): 36-41.
[8] 王昊, 李思舒, 邓三鸿. 基于N-Gram的文本语种识别研究[J]. 现代图书情报技术, 2013, (4): 54-61.
[9] 袁冬, 熊晶, 刘永革. 面向甲骨文的实例机器翻译技术研究[J]. 现代图书情报技术, 2012, 28(5): 48-54.
[10] 康小丽, 章成志. 用于双语术语抽取的专业领域中英文可比语料库构建[J]. 现代图书情报技术, 2012, 28(2): 28-33.
[11] 谢靖, 苏新宁, 沈思. CSSCI语料中短语结构标注与自动识别[J]. 现代图书情报技术, 2012, (12): 32-38.
[12] 王东波, 韩普, 沈思, 魏向清. 基于英汉双语短语级平行语料的类别知识挖掘研究[J]. 现代图书情报技术, 2012, (11): 40-46.
[13] 冯冠军, 禹龙, 田生伟. 基于CRFs自动构建维吾尔语情感词语料库[J]. 现代图书情报技术, 2011, 27(3): 17-21.
[14] 吴琳,魏星,霍翠婷. 基于Web的专利双语语料自动获取研究及实现*——以esp@cenet数据库为例[J]. 现代图书情报技术, 2009, (9): 57-63.
[15] 王东波,苏新宁. 英汉双语句子级平行语料库自动构建*[J]. 现代图书情报技术, 2009, 25(12): 47-51.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn