Please wait a minute...
Advanced Search
现代图书情报技术  2012, Vol. Issue (11): 60-64     https://doi.org/10.11925/infotech.1003-3513.2012.11.10
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
相似专利检测研究
周群芳
宝山钢铁股份有限公司 上海 201900
Study on Detection Method of Similarity Patents
Zhou Qunfang
Baoshan Iron and Steel Co., Ltd., Shanghai 201900, China
全文: PDF (537 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 为从专利库中获取有效的相似专利,在基于本体的标识替换基础上,合并相似概念,通过对概念TFIDF值的测算,构建向量空间模型,计算每篇专利文档的相似度,并利用基于有序最长公共子序列匹配的句子相似度识别方法,对前面的相似专利文档抽取结果做进一步匹配,最终得到相似子句集合,以帮助企业情报人员实现相似专利的有效检测。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
周群芳
关键词 本体相似专利检测专利侵权    
Abstract:In order to get similar patents from patent databases, based on merging similar concepts on Ontology-based identification replacement, this paper constructs a vector space model by estimating the TFIDF values of the concepts, and eventually gets a collection of similar clause on similarity matching sentences by orderly longest common subsequence identification method to match the results of previous similar patent document extraction. This method can help enterprises intelligence detect similar patents effectively.
Key wordsOntology    Similar patent detection    Patent infringement
收稿日期: 2012-11-02      出版日期: 2013-02-06
:  TP391  
通讯作者: 周群芳     E-mail: qfzhou@baosteel.com
引用本文:   
周群芳. 相似专利检测研究[J]. 现代图书情报技术, 2012, (11): 60-64.
Zhou Qunfang. Study on Detection Method of Similarity Patents. New Technology of Library and Information Service, 2012, (11): 60-64.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2012.11.10      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2012/V/I11/60
[1] Fujii A, Ishikawa T. Document Structure Analysis for the NTCIR-5 Patent Retrieval[C]. In: Proceedings of the 5th NTCIR Workshop on Evaluation of Information Access Technologies, Information Retrieval, Question Answering and Cross-Lingual Information Access,Tokyo, Japan.2005.
[2] Park H, Yoon J, Kim K. Identifying Patent Infringement Using SAO Based Semantic Technological Similarities[J]. Scientometrics, 2012, 90(2):515-529.
[3] 汪雪锋,刘玉琴,刘佳. 中文专利侵权检索模型研究[J]. 计算机工程与应用,2009,45(9):212-215.(Wang Xuefeng, Liu Yuqin, Liu Jia. Research on Chinese Patent Infringement Retrieval Model[J]. Computer Engineering and Applications,2009,45(9):212-215.)
[4] 马文姗,赵海宁,翟东升.中文专利侵权检索模型研究[J]. 情报杂志,2012 (4):175-179.(Ma Wenshan, Zhao Haining, Zhai Dongsheng. Research on Chinese Patent Infringement Retrieval Model[J]. Journal of Intelligence,2012 (4):175-179.)
[5] Brin S, Davis J, Garcia-Molina H. Copy Detection Mechanisms for Digital Documents[C].In: Proceedings of the 1995 ACM SIGMOD International Conference on Management of Data (SIGMOD'95). New York: ACM, 1995: 398-409.
[6] Shivakumar N, Garcia-Molina H. SCAM: A Copy Detection Mechanism for Digital Documents[C]. In: Proceedings of the 2nd International Conference on Theory and Practice of Digital Libraries, Austin, Texas,USA.1995.
[7] Si A, Leong H V, Lau R W H. CHECK: A Document Plagiarism Detection System[C]. In: Proceedings of the 1997 ACM Symposium on Applied Computing (SAC'97). New York: ACM, 1997:70-77.
[8] 杨思春. 一种改进的句子相似度计算模型[J]. 电子科技大学学报, 2006, 35(6): 956-959.(Yang Sichun. An Improved Model for Sentence Similarity Computing[J]. Journal of University of Electronic Science and Technology of China, 2006, 35(6): 956-959.)
[9] 秦新国. 基于句子相似度的文档复制检测算法研究[J]. 现代图书情报技术, 2007(11): 63-66.(Qin Xinguo. Research on the Copy Detection Based on the Similarity of Sentences[J]. New Technology of Library and Information Service, 2007(11): 63-66.)
[10] 王森, 王宇. 基于文本结构树的论文复制检测算法[J]. 现代图书情报技术, 2009(10): 50-55.(Wang Sen, Wang Yu. Algorithm of the Text Copy Detection Based on Text Structure Tree[J]. New Technology of Library and Information Service, 2009(10): 50-55.)
[11] 孙伟, 邢长征. 关于中文文档复制检测算法的改进[J]. 计算机工程与科学, 2010, 32(8): 101-103.(Sun Wei, Xing Changzheng. An Improved Copy Detection Algorithm for the Chinese Documents[J]. Computer Engineering and Science, 2010, 32(8): 101-103.)
[12] 张培颖. 多特征融合的语句相似度计算模型[J]. 计算机工程与应用, 2010, 46(26): 136-137.(Zhang Peiying. Model for Sentence Similarity Computing Based on Multi-features Combination[J]. Computer Engineering and Applications, 2010, 46(26): 136-137.)
[13] 谷俊,朱紫阳. 基于聚类算法的本体层次关系获取研究[J]. 现代图书情报技术, 2011(12):46-51.(Gu Jun, Zhu Ziyang. Study on Ontology Hierarchy Relation Induction on Clustering Algorithm[J]. New Technology of Library and Information Service, 2011(12):46-51.)
[14] GUID[EB/OL].[2012-05-27]. http://baike.baidu.com/view/185358.htm.
[15] Wikipedia. Cosine Similarity[EB/OL].[2012-05-27]. http://en.wikipedia.org/wiki/Cosine_similarity.
[16] Hirschberg D S. Algorithms for the Longest Common Subsequence Problem[J]. Journal of the ACM, 1977, 24(4): 664-675.
[17] 冷强奎, 秦玉平, 王春立. 基于句子相似度的论文抄袭检测模型研究[J]. 计算机工程与应用, 2011, 47(24): 199-201.(Leng Qiangkui,Qin Yuping,Wang Chunli. Study on Model for Plagiarism-detection of Scientific Papers Based on Sentence Similarity[J].Computer Engineering and Applications, 2011, 47(24): 199-201.)
[1] 吕学强,罗艺雄,李家全,游新冬. 中文专利侵权检测研究综述*[J]. 数据分析与知识发现, 2021, 5(3): 60-68.
[2] 盛姝, 黄奇, 杨洋, 解绮雯, 秦新国. HL7 FHIR框架下中国医疗领域信息交换研究与解决方案[J]. 数据分析与知识发现, 2021, 5(11): 13-28.
[3] 曾桢,李纲,毛进,陈璟浩. 区域公共安全数据治理与业务领域本体研究*[J]. 数据分析与知识发现, 2020, 4(9): 41-55.
[4] 李家全,李宝安,游新冬,吕学强. 基于专利知识图谱的专利术语相似度计算研究*[J]. 数据分析与知识发现, 2020, 4(10): 104-112.
[5] 强韶华,罗云鹿,李玉鹏,吴鹏. 基于RBR和CBR的金融事件本体推理研究 *[J]. 数据分析与知识发现, 2019, 3(8): 94-104.
[6] 邓诗琦,洪亮. 面向智能应用的领域本体构建研究*——以反电话诈骗领域为例[J]. 数据分析与知识发现, 2019, 3(7): 73-84.
[7] 高广尚. 用户画像构建方法研究综述*[J]. 数据分析与知识发现, 2019, 3(3): 25-35.
[8] 王颖,钱力,谢靖,常志军,孔贝贝. 科技大数据知识图谱构建模型与方法研究*[J]. 数据分析与知识发现, 2019, 3(1): 15-26.
[9] 何有世, 何述芳. 基于领域本体的产品网络口碑信息多层次细粒度情感挖掘*[J]. 数据分析与知识发现, 2018, 2(8): 60-68.
[10] 唐慧慧, 王昊, 张紫玄, 王雪颖. 基于汉字标注的中文历史事件名抽取研究*[J]. 数据分析与知识发现, 2018, 2(7): 89-100.
[11] 庞贝贝, 苟娟琼, 穆文歆. 面向高校学生深度辅导领域的主题建模和主题上下位关系识别研究*[J]. 数据分析与知识发现, 2018, 2(6): 92-101.
[12] 丁晟春, 刘梦露, 傅柱. 概念设计中基于知识流的多维设计知识统一建模技术研究*[J]. 数据分析与知识发现, 2018, 2(2): 11-19.
[13] 涂海丽, 唐晓波. 基于标签的商品推荐模型研究*[J]. 数据分析与知识发现, 2017, 1(9): 28-39.
[14] 陈二静, 姜恩波. 文本相似度计算方法研究综述[J]. 数据分析与知识发现, 2017, 1(6): 1-11.
[15] 白如江, 冷伏海, 廖君华. 一种基于语义组块特征的改进Cosine文本相似度计算方法*[J]. 数据分析与知识发现, 2017, 1(6): 56-64.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn