Please wait a minute...
Advanced Search
现代图书情报技术  2007, Vol. 2 Issue (11): 40-44     https://doi.org/10.11925/infotech.1003-3513.2007.11.08
  21届机检会论文选登 本期目录 | 过刊浏览 | 高级检索 |
基于句子匹配的文章自写度测评系统
化柏林
(中国科学技术信息研究所 北京 100038)
Article Novelty Evaluation System Based on Sentence Matching
Hua Bolin
(Institute of Scientific and Technical Information of China, Beijing 100038, China)
全文: PDF (677 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

针对人工进行不同文章中相同内容的判断存在着较大困难的局面,提出一个基于句子匹配的文章自写度测评系统。设计基于句子匹配的文章自写度测评系统的系统结构,论述句子分析器、句子匹配器与文章自写度评价器3个关键模块的详细流程,并设计相应算法。选取小规模数据进行实验,实验结果表明,基于句子匹配的文章自写度测评系统从技术上完全可行。最后分析基于句子匹配的文章自写度测评系统的难点及问题。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
化柏林
关键词 参考文献内容分析句子匹配辅助审稿句子相似度    
Abstract

This paper constructs a Article Novelty Evaluation System based on Sentence Matching(ANES-SM), aiming to overcome the difficulty of recognizing same contents between an article and other articles manually. Architecture of ANES-SM is built, and definite flow of key module is analyzed and algorithm is designed, inclading sentence analyzer, sentence matcher and article novelty evaluator. Experiment shows that it is feasible.

Key wordsReference    Content analysis    Sentence matching    Aided-review    Sentence similarity
收稿日期: 2007-07-12      出版日期: 2007-11-25
: 

TP391 

 
     
  G31

 
通讯作者: 化柏林      E-mail: huabolin@istic.ac.cn
作者简介: 化柏林
引用本文:   
化柏林 . 基于句子匹配的文章自写度测评系统[J]. 现代图书情报技术, 2007, 2(11): 40-44.
Hua Bolin. Article Novelty Evaluation System Based on Sentence Matching. New Technology of Library and Information Service, 2007, 2(11): 40-44.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2007.11.08      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2007/V2/I11/40

[1] 吕学强,任飞亮,黄志丹,等.句子相似模型和最相似句子查找算法[J].东北大学学报(自然科学版),2003,24(6):531-534.
[2] 姚建民,周明,赵铁军,等.基于句子相似度的机器翻译评价方法及其有效性分析[J].计算机研究与发展,2004,41(4):1258-1265.
[3] 王荣波,池哲儒.基于词类串的汉语句子结构相似度计算方法[J].中文信息学报,2005,19(1):21-29.
[4] 王荣波,池哲儒,常宝宝,等.基于词串粒度及权值的汉语句子相似度衡量[J].计算机工程,2005,31(13):142-144.
[5] 黄河燕,陈肇雄,张孝飞,等.大规模句子相似度计算方法[J].中文信息学报,2006,20(S1):47-52.
[6] 林贤明,李堂秋,陈毅东.句子相似度的动态规划求解及改进[J].计算机工程与应用,2004,40(35):64-65,93.
[7] 李彬,刘挺,秦兵,等.基于语义依存的汉语句子相似度计算[J].计算机应用研究, 2003,20(12):15-17.
[8] 张琦,黄萱菁,吴立德.一种新的句子相似度度量及其在文本自动摘要中的应用[J].中文信息学报,2005,19(2):93-99.
[9] 秦兵,刘挺,王洋,等.基于常问问题集的中文问答系统研究[J].哈尔滨工业大学学报,2003,35(10):1179-1182.
[10] 廉站俊,吕学强,张玉杰,等.基于句子相似度计算的信息抽取[J].现代图书情报技术,2007(6):38-41.
[11] 金博,史彦军,滕弘飞.基于语义理解的文本相似度算法[J].大连理工大学学报,2005,45(2):291-297.
[12] 车万翔,刘挺,秦兵,等.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19.
[13] 郑逢斌,陈志国,姜保庆,等.语义校对系统中的句子语义骨架模糊匹配算法[J].电子学报,2003,31(8):1138-1140.
[14] 李卫,王极,李蕾,等.全信息知识制导的科技期刊初审辅助系统[J].北京邮电大学学报,2006,29(S1):127-132.
[15] 刘颖.计算语言学[M].北京:清华大学出版社,2002:45-46.

[1] 金贤日,欧石燕. 无监督引用文本自动识别与分析*[J]. 数据分析与知识发现, 2021, 5(1): 66-77.
[2] 石静,厉臣璐,钱宇星,周利琴,张斌. 国内外健康问答社区用户信息需求对比研究*——基于主题和时间视角的实证分析[J]. 数据分析与知识发现, 2019, 3(5): 1-10.
[3] 吴聪, 赵宇翔, 朱庆华. 基于任务展示示能性的众筹项目视频分析*——以众筹网为例[J]. 数据分析与知识发现, 2017, 1(10): 64-76.
[4] 肖学斌,柴艳菊. 论文的相关参数与被引频次的关系研究[J]. 现代图书情报技术, 2016, 32(6): 46-53.
[5] 黄晓斌, 钟辉新. 内容分析法在商业网络广告情报萃取中的运用——以中国三大电信运营商为例[J]. 现代图书情报技术, 2012, 28(7): 90-95.
[6] 袁冬, 熊晶, 刘永革. 面向甲骨文的实例机器翻译技术研究[J]. 现代图书情报技术, 2012, 28(5): 48-54.
[7] 王志超, 翁楠, 王宇. 基于主题句相似度的标题党新闻鉴别技术研究[J]. 现代图书情报技术, 2011, (11): 48-53.
[8] 袁红. 基于网络内容分析的高校门户网站可用性测评 ——以江苏省为例[J]. 现代图书情报技术, 2010, 26(10): 70-75.
[9] 陈定权,刘颉颃. 参考文献管理软件评析与展望*——以EndNote、NoteExpress为例[J]. 现代图书情报技术, 2009, 25(7-8): 80-84.
[10] 何维,王宇. 基于句子关系图的网页文本主题句抽取*[J]. 现代图书情报技术, 2009, 3(3): 57-61.
[11] 王森,王宇. 基于文本结构树的论文复制检测算法[J]. 现代图书情报技术, 2009, (10): 50-55.
[12] 王敏,张志强. 图书情报领域知识发现研究文献内容分析[J]. 现代图书情报技术, 2008, 24(2): 64-68.
[13] 高文利,高元先. 学位论文参考文献的自动抽取及标注[J]. 现代图书情报技术, 2008, 24(11): 72-75.
[14] 廉站俊,吕学强,张玉杰,施水才. 基于句子相似度计算的信息抽取*[J]. 现代图书情报技术, 2007, 2(6): 38-41.
[15] 张少龙,吴佳鑫 . 语音信息的内容分析技术研究综述[J]. 现代图书情报技术, 2007, 2(4): 28-31.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn