Please wait a minute...
Advanced Search
现代图书情报技术  2015, Vol. 31 Issue (7-8): 58-64    DOI: 10.11925/infotech.1003-3513.2015.07.08
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于知网的甲骨卜辞释义问题的可拓性研究
高峰, 熊晶, 刘永革
1 安阳师范学院计算机与信息工程学院 安阳 455002;
2 河南省甲骨文信息处理重点实验室培育基地 安阳 455002
Research on the Extenics of Oracle Bone Inscriptions Interpretation Based on HowNet
Gao Feng, Xiong Jing, Liu Yongge
(School of Computer and Information Engineering, Anyang Normal University, Anyang 455002, China;
(Henan Province Key Laboratory Cultivation Base for Oracle Bone Inscriptions Information Processing, Anyang 455002, China
全文: PDF(796 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

目的】构建可拓的甲骨文语言模型并结合甲骨文知网知识库解决甲骨卜辞释义问题。【方法】借鉴知网的构建体系, 建立一个融合甲骨文、现代汉语的语义知识库, 对甲骨卜辞进行可拓语言建模, 结合知网的知识表示, 进行语义相似度计算和对应的可拓策略应用。【结果】实验结果表明, 该方法在甲骨卜辞的词义识别准确率可达到90%以上, 在甲骨卜辞的残辞语义推导上准确率可达75%以上, 能够有效解决甲骨卜辞释义问题。【局限】甲骨文知网的构建规模较小及可拓策略的成熟度不高制约着甲骨卜辞语义信息的自动理解。【结论】结合甲骨文可拓语言模型和甲骨文知网进行甲骨文信息处理研究, 为甲骨字的语义推导和残缺甲骨拓片的文本内容整合提供新的解决方案。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
Abstract

[Objective] To solve the Oracle Bone Inscriptions (OBI) interpretation of ambiguity and semantic problems by constructing extenics OBI language model and OBI HowNet knowledge base. [Methods] Based on HowNet framework, a semantic knowledge base combined with OBI and modern Chinese is proposed. The OBI extenics language model is introduced and fusing the HowNet knowledge representation method, and it can implement semantic similarity computation and related extension strategy application. [Results] Small-scale experiments show that the method can reach more than 90% on OBI of the correctness of the definition of ambiguity recognition, and more than 75% on OBI for the residual alteration of the righteous. It can effectively solve the problem of OBI interpretation. [Limitations] The limit of OBI HowNet knowledge base scale and extension strategy maturity restricts the semantic information of automatic understanding on OBI. [Conclusions] The OBI information processing research is based on extenics OBI language model and OBI HowNet knowledge base. It provides a new solution for OBI characters semantic deduction and incomplete OBI rubbing text integration.

收稿日期: 2014-11-21     
:  TP311.13  
基金资助:

本文系河南省高等学校重点科研项目"基于知网的甲骨文语言建模技术与可拓方法研究"(项目编号:15A520005)、河南省高校青年骨干教师资助计划"基于本体的甲骨文知识可视化方法研究"(项目编号:2014GGJS-106)和河南省高校科技创新人才支持计划"汉字语义的本体描述及知识图谱构建"(项目编号:15HASTIT023)的研究成果之一。

通讯作者: 高峰 ORCID: 0000-0002-1804-8390, E-mail: gaof97@163.com。     E-mail: gaof97@163.com
作者简介: 作者贡献声明: 高峰: 提出研究思路, 设计研究方案, 论文起草及最终版本修订; 熊晶: 采集、清洗和分析甲骨文数据, 实施实验; 刘永革: 论文修订。
引用本文:   
高峰, 熊晶, 刘永革. 基于知网的甲骨卜辞释义问题的可拓性研究[J]. 现代图书情报技术, 2015, 31(7-8): 58-64.
Gao Feng, Xiong Jing, Liu Yongge. Research on the Extenics of Oracle Bone Inscriptions Interpretation Based on HowNet. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2015.07.08.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2015.07.08

[1] 王宇信, 杨升南, 聂玉海. 甲骨文精粹释译[M]. 昆明: 云南人民出版社, 2004. (Wang Yuxin, Yang Shengnan, Nie Yuhai. The Interpretation of the Essence for Oracle Bone Inscriptions [M]. Kunming: Yunnan People's Publishing House, 2004.)
[2] 熊晶, 高峰, 吴琴霞. 甲骨文计算机辅助翻译技术研究[J]. 科学技术与工程, 2014, 14(2): 179-182. (Xiong Jing, Gao Feng, Wu Qinxia. Research of Computer-aided Translation Technology for Oracle Bone Inscriptions [J]. Science Technology and Engineering, 2014, 14(2): 179-182.)
[3] 葛斌, 李芳芳, 郭丝路, 等. 基于知网的词汇语义相似度计算方法研究[J]. 计算机应用研究, 2010, 27(9): 3329-3333. (Ge Bin, Li Fangfang, Guo Silu, et al. Word's Semantic Similarity Computation Method Based on HowNet [J]. Application Research of Computers, 2010, 27(9): 3329- 3333.)
[4] 郑鑫, 秦建军, 陈汉辉, 等. 基于可拓学的自然语言处理与系统建模研究[J]. 哈尔滨工业大学学报, 2006, 38(7): 1209-1212. (Zheng Xin, Qin Jianjun, Chen Hanhui, et al. Natural Language Processing and Its System Modeling Based on Extenics [J]. Journal of Harbin Institute of Technology, 2006, 38(7): 1209-1212.)
[5] 任瑞春, 刘巍. 可拓方法在古文今译中的应用[C]. 见: 2005年中国模糊逻辑与计算智能联合学术会议, 深圳, 中国.2005: 356-359. (Ren Ruichun, Liu Wei. The Application of Extension Methods in Translation of Ancient Writing [C]. In: Proceedings of Faculty Position in Machine Learning/ Artificial Intelligence (FLCI2005), Shenzhen, China. 2005: 356-359.)
[6] 李卫华. 利用知网增强可拓策略生成机制研究[J]. 广东工业大学学报, 2013, 30(2): 1-6. (Li Weihua. Research on Taking Advantage of HowNet to Enhance Mechanisms of Extension Strategy Generation [J]. Journal of Guangdong University of Technology, 2013, 30(2): 1-6.)
[7] 赵杰, 李卫华. 基于知网的矛盾问题语义二义性研究[J]. 广东工业大学学报, 2014, 31(2): 21-26. (Zhao Jie, Li Weihua. Research on the Ambiguity of Contradiction Based on HowNet [J]. Journal of Guangdong University of Technology, 2014, 31(2): 21-26.)
[8] 赵燕伟, 苏楠. 可拓设计[M]. 北京: 科学出版社, 2010. (Zhao Yanwei, Su Nan. Extension Design [M]. Beijing: Science Press, 2010.)
[9] 杨春燕, 蔡文. 可拓工程[M]. 北京: 科学出版社, 2008. (Yang Chunyan, Cai Wen. Extension Engineering [M]. Beijing: Science Press, 2008.)
[10] 蔡文, 杨春燕. 可拓学的基础理论与方法体系[J]. 科学通报, 2013, 58(13): 1190-1199. (Cai Wen, Yang Chunyan. Basic Theory and Methodology on Extenics [J]. Chinese Science Bulletin, 2013, 58(13): 1190-1199.)
[11] HowNet Knowledge Database [EB/OL]. [2015-03-17]. http:// www.keenage.com.
[12] 裴婧, 包宏. 汉语句子相似度计算在FAQ中的应用[J]. 计算机工程, 2009, 35(17): 46-48. (Pei Jing, Bao Hong. Application of Chinese Sentence Similarity Computation in FAQ [J]. Computer Engineering, 2009, 35(17): 46-48.)
[13] 刘群, 李素建. 基于《知网》的词汇语义相似度计算[J]. Computational Linguistics and Chinese Language Processing, 2002, 7(2): 59-76. (Liu Qun, Li Sujian. Word Similarity Computing Based on How-net [J]. Computational Linguistics and Chinese Language Processing, 2002, 7(2): 59-76.)
[14] 李峰, 李芳. 中文词语语义相似度计算——基于《知网》2000[J]. 中文信息学报, 2007, 21(3): 99-105. (Li Feng, Li Fang. A New Approach Measuring Semantic Similarity in HowNet 2000 [J]. Journal of Chinese Information Processing, 2007, 21(3): 99-105.)
[15] Xiong J, Gao F, Liu Y. Word Segmentation Method for Oracle Bone Inscriptions Based on Dictionary and Syntactic Rules [C]. In: Proceedings of the 7th International Conference on System of Systems Engineering (SOSE). IEEE, 2012: 902-905.

[1] 刘伙玉, 王东波. 面向论文相似性检测的数据预处理研究[J]. 现代图书情报技术, 2015, 31(5): 50-56.
[2] 邢小云, 魏婧. 在线社会网络结构演化及其对口碑传播的影响研究[J]. 现代图书情报技术, 2011, 27(9): 60-65.
[3] 陈俊林,张文德 . 基于XSLT的PDF论文元数据的优化抽取[J]. 现代图书情报技术, 2007, 2(2): 18-23.
[4] 陶剑文 . 基于多Agent的智能推荐算法设计*[J]. 现代图书情报技术, 2006, 1(12): 49-53.
[5] 佘俊胜,黄战 . 一种面向图书馆新书推荐服务的广义关联规则挖掘算法[J]. 现代图书情报技术, 2006, 1(10): 16-20.
[6] 毛力 . 学术数据库与普及型搜索引擎的合作研究[J]. 现代图书情报技术, 2006, 1(9): 13-17.
[7] 陈俊林,张文德 . XML文档的数据库转换技术研究*[J]. 现代图书情报技术, 2006, 1(9): 38-42.
[8] 王媛媛,钟永恒 . 基于SQL Server 2005的Web日志挖掘系统构建[J]. 现代图书情报技术, 2006, 1(5): 58-61.
[9] 李贺,周敬 . 虚拟企业伙伴选择评价信息系统的构建研究[J]. 现代图书情报技术, 2006, 1(5): 65-68.
[10] 司徒浩臻. 数据挖掘技术在图书馆信息服务中的应用[J]. 现代图书情报技术, 2005, 21(10): 15-18.
[11] 郭瑞华. XML数据的存储策略研究[J]. 现代图书情报技术, 2005, 21(6): 65-69.
[12] 王昊. 基于关联规则挖掘研究学科间相关性[J]. 现代图书情报技术, 2005, 21(3): 23-28.
[13] 张婷. 精确数据的模糊查询工具的设计与实现  [J]. 现代图书情报技术, 2004, 20(12): 36-39.
[14] 孙辉. 基于RDBMS的XML数据存储研究[J]. 现代图书情报技术, 2004, 20(9): 58-60.
[15] 郭瑞华. XML 数据库技术[J]. 现代图书情报技术, 2004, 20(9): 61-65.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn