Please wait a minute...
Advanced Search
现代图书情报技术  2013, Vol. Issue (6): 23-29     https://doi.org/10.11925/infotech.1003-3513.2013.06.04
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
审判案例自动抽取与标注模型研究
佘贵清, 张永安
北京工业大学经济与管理学院 北京 100124
Study on the Model of Automatic Extraction and Annotation of Trail Cases
She Guiqing, Zhang Yongan
School of Economics and Management, Beijing University of Technology, Beijing 100124, China
全文: PDF (1413 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 针对刑事判决书文本,结合刑事审判本体,构建基于本体的案例自动抽取与标注模型。基于法律案例文本的半结构化特征,依据文档组织结构和线索词,运用正则表达式构建抽取规则模板;同时结合自然语言处理技术进行相关语义信息的精准抽取。 运用语义标注技术构建刑事审判本体实例库,实现大量案例文本向语义信息网络的转化,便于运用语义信息进行 相似案例检索和审判推荐。实验证明,该模型的抽取结果基本达到预期效果。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
佘贵清
张永安
关键词 语义标注本体规则抽取自然语言处理    
Abstract:This paper constructs an Ontology-based automatic extraction and annotation model for the massive texts of criminal judgments combined with the case-Ontology. It uses regular expressions to construct extraction rules and templates for the semi-structured characteristics of the texts of legal cases, according to the structure of the documents and the clue words. Besides, it applies natural language processing techniques for the accurate information extraction, then gives semantic annotation of the results of extraction for building an Ontology knowledge base of legal cases, to realize the transformation of case texts to semantic information Web, for the further similar case retrieval and judge recommendation. And the experiment shows a good result.
Key wordsSemantic annotation    Ontology    Rule extraction    Natural language processing
收稿日期: 2013-03-22      出版日期: 2013-07-24
:  D926.22  
  TP399  
通讯作者: 佘贵清     E-mail: sheguiqing@263.net
引用本文:   
佘贵清, 张永安. 审判案例自动抽取与标注模型研究[J]. 现代图书情报技术, 2013, (6): 23-29.
She Guiqing, Zhang Yongan. Study on the Model of Automatic Extraction and Annotation of Trail Cases. New Technology of Library and Information Service, 2013, (6): 23-29.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2013.06.04      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2013/V/I6/23
[1] Uschold M,Gruninger M.Ontologies and Semantics for Seamless Connectivity[J]. ACM SIGMOD Record,2004,33(4):58-64.
[2] Berners-Lee T, Hendler J,Lassila O.The Semantic Web[J].Scientific American Magazine,2001,284(5): 28-37.
[3] Cardie C.Empirical Methods in Information Extraction[J].AI Magazine,1997,18(4):65-78.
[4] Popov B,Kiryakov A, Kirilov A, et al.KIM-Semantic Annotation Platform[C].In: Proceedings of the 2nd International Semantic Web Conference(ISWC’2003),Florida,USA. 2003:834-849.
[5] 荆涛,左万利,孙吉贵, 等.中文网页语义标注:由句子到RDF表示[J]. 计算机研究与发展,2008,45(7):1221-1231.(Jing Tao,Zuo Wanli,Sun Jigui,et al. Semantic Annotation of Chinese Web Pages: From Sentences to RDF Representations[J].Computer Research and Development,2008,45(7):1221-1231.)
[6] 高琦.基于Bootstrapping的本体标注方法研究[D].重庆:重庆大学,2010.(Gao Qi.A New Annotate Ontology Method Based on Bootstrapping[D].Chongqing:Chongqing University,2010.)
[7] Pandit S. Ontology-guided Extraction of Structured Information from Unstructured Text: Identifying and Capturing Complex Relationships[D].Ames: Iowa State University,2010.
[8] 章勇,吕俊白.基于Protégé的本体建模研究综述[J]. 福建电脑,2011, 27(1):43-45.(Zhang Yong,Lv Junbai.The Research Review of Ontology Modeling Based on Protégé[J].FuJian Computer,2011, 27(1):43-45.)
[9] 刘克强.2009 共享版 ICTCLAS 的分析与使用[J]. 科教文汇,2009(22): 271.(Liu Keqiang.The Analysis and Instructions for the 2009 Shared Version Of ICTCLAS[J].Education Science & Culture Magazine,2009(22): 271.)
[1] 王一钒,李博,史话,苗威,姜斌. 古汉语实体关系联合抽取的标注方法*[J]. 数据分析与知识发现, 2021, 5(9): 63-74.
[2] 盛姝, 黄奇, 杨洋, 解绮雯, 秦新国. HL7 FHIR框架下中国医疗领域信息交换研究与解决方案[J]. 数据分析与知识发现, 2021, 5(11): 13-28.
[3] 曾桢,李纲,毛进,陈璟浩. 区域公共安全数据治理与业务领域本体研究*[J]. 数据分析与知识发现, 2020, 4(9): 41-55.
[4] 凌洪飞,欧石燕. 面向主题模型的主题自动语义标注研究综述 *[J]. 数据分析与知识发现, 2019, 3(9): 16-26.
[5] 黄名选,卢守东,徐辉. 基于加权关联模式挖掘与规则后件扩展的跨语言信息检索 *[J]. 数据分析与知识发现, 2019, 3(9): 77-87.
[6] 强韶华,罗云鹿,李玉鹏,吴鹏. 基于RBR和CBR的金融事件本体推理研究 *[J]. 数据分析与知识发现, 2019, 3(8): 94-104.
[7] 胡佳慧,方安,赵琬清,杨晨柳,任慧玲. 面向知识发现的中文电子病历标注方法研究 *[J]. 数据分析与知识发现, 2019, 3(7): 123-132.
[8] 邓诗琦,洪亮. 面向智能应用的领域本体构建研究*——以反电话诈骗领域为例[J]. 数据分析与知识发现, 2019, 3(7): 73-84.
[9] 高广尚. 用户画像构建方法研究综述*[J]. 数据分析与知识发现, 2019, 3(3): 25-35.
[10] 王颖,钱力,谢靖,常志军,孔贝贝. 科技大数据知识图谱构建模型与方法研究*[J]. 数据分析与知识发现, 2019, 3(1): 15-26.
[11] 何有世, 何述芳. 基于领域本体的产品网络口碑信息多层次细粒度情感挖掘*[J]. 数据分析与知识发现, 2018, 2(8): 60-68.
[12] 唐慧慧, 王昊, 张紫玄, 王雪颖. 基于汉字标注的中文历史事件名抽取研究*[J]. 数据分析与知识发现, 2018, 2(7): 89-100.
[13] 庞贝贝, 苟娟琼, 穆文歆. 面向高校学生深度辅导领域的主题建模和主题上下位关系识别研究*[J]. 数据分析与知识发现, 2018, 2(6): 92-101.
[14] 丁晟春, 刘梦露, 傅柱. 概念设计中基于知识流的多维设计知识统一建模技术研究*[J]. 数据分析与知识发现, 2018, 2(2): 11-19.
[15] 涂海丽, 唐晓波. 基于标签的商品推荐模型研究*[J]. 数据分析与知识发现, 2017, 1(9): 28-39.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn