Please wait a minute...
Advanced Search
现代图书情报技术  2011, Vol. 27 Issue (4): 42-47     https://doi.org/10.11925/infotech.1003-3513.2011.04.07
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
面向汉语自动句法分析的语法知识库构建
王东波, 朱丹浩, 谢靖
南京大学信息管理系 南京 210093
Constructing the Grammar Knowledge Database Orienting Chinese Automatic Sentence Analysis
Wang Dongbo, Zhu Danhao, Xie Jing
Department of Information Management, Nanjing University, Nanjing 210093, China
全文: PDF (648 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 基于100万字的973汉语树库,按照语法功能分布的理论,从汉语自动句法分析和语言知识库构建的角度,构建一个相对系统化和多层次的语法知识库。该语法知识库由汉语词语、短语实例、短语结构、句法规则等知识组成。汉语词语知识共统计51 390个汉语词汇的58种语法知识,短语实例知识共获取3 836个汉语短语实例的58种语法知识,短语结构知识共抽取26种短语结构的58种知识,句法规则共有900条记录知识组成。该语法知识库的构建不仅为汉语自动句法分析和语言学研究提供语法知识,而且为更大规模的语法知识库构建打下基础。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
谢靖
王东波
朱丹浩
关键词 汉语自动句法分析语法知识库语法功能分布973汉语树库    
Abstract:According to grammar function distribution, a relatively multilevel and systematic grammar knowledge database based on 973 Treebank is constructed from the standpoint of Chinese parser and linguistic knowledge database construction. The grammar knowledge database consists of Chinese syntax knowledge, instance functions of syntax structure and structures’ syntax knowledge. The 51 390 Chinese word’s functions which include 58 kinds of function are gained. The 3 836 instance functions of syntax structure with 58 kinds of function are extracted. The 26 structures’ with 58 kinds of function syntax function are got. There are 900 Chinese sentences rules in the knowledge database. The grammar knowledge database not only offers the syntax knowledge to the Chinese automatic sentence analysis and linguistic researches, but also provides a model for the large-scale linguistic knowledge database construction.
Key wordsChinese automatic sentence analysis    Grammar knowledge database    Grammar function distribution    973 Treebank
收稿日期: 2011-03-14      出版日期: 2011-06-11
: 

TP391

 
基金资助:

本文系教育部人文社会科学重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究”(项目编号:08JJD870225)和2010年南京大学研究生科研创新基金资助项目“基于网络的英汉/汉英平行语料对自动获取”(项目编号:2010CW02)的研究成果之一。

引用本文:   
王东波, 朱丹浩, 谢靖. 面向汉语自动句法分析的语法知识库构建[J]. 现代图书情报技术, 2011, 27(4): 42-47.
Wang Dongbo, Zhu Danhao, Xie Jing. Constructing the Grammar Knowledge Database Orienting Chinese Automatic Sentence Analysis. New Technology of Library and Information Service, 2011, 27(4): 42-47.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2011.04.07      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2011/V27/I4/42
[1] About WorNet[EB/OL].[2011-02-26]. http://wordnet.princeton.edu/.

[2] 董振东,董强.知网和汉语研究[J].当代语言学,2001,3(1):33-44.

[3] 刘扬,于江生,俞士汶.CCD构造模型及VACOL辅助软件的设计与实现[J].语言文字应用,2003(1):83-88.

[4] 俞士汶,朱学锋,王惠.《现代汉语语法信息词典》的新进展[J].中文信息学报,2001,15(1):59-64,F0003.

[5] 许嘉璐, 朱小健.中文信息处理研究工作的新进展[J].云南师范大学学报:哲学社会科学版,2010,42(4):1-6.

[6] 刘亮.现代汉语广义助词知识库构建与应用[J].光盘技术,2008(4):14-16.

[7] 彭爽,俞士汶.现代汉语介词知识库的建设[J]. 社会科学战线,2009(8):247-249.

[8] 朱德熙.语法讲义[M].北京:商务印书馆,1982.

[9] 陈小荷.从自动句法分析角度看汉语词类问题[J].语言教学与研究,1999(3):63-72.

[10] 徐艳华.现代汉语实词语法功能考察及词类体系重构[D].南京:南京师范大学,2006.
[1] 吕英杰, 范静, 刘景方. 基于文体学的中文UGC作者身份识别研究[J]. 现代图书情报技术, 2013, 29(9): 48-53.
[2] 王昊, 邹杰利, 邓三鸿. 面向中文图书的自动标引模型构建及实验分析[J]. 现代图书情报技术, 2013, 29(7/8): 55-62.
[3] 郭舒. 文献数据库中作者名消歧算法研究[J]. 现代图书情报技术, 2013, 29(7/8): 69-74.
[4] 胡昌平, 陈果. 共词分析中的词语贡献度特征选择研究[J]. 现代图书情报技术, 2013, 29(7/8): 89-93.
[5] 李霄, 丁晟春. 垃圾商品评论信息的识别研究[J]. 现代图书情报技术, 2013, 29(1): 63-68.
[6] 曾少勤, 王惠临, 张寅生. 汉语文本的最小递归语义表示研究——以名词性量化短语为例[J]. 现代图书情报技术, 2012, (10): 35-41.
[7] 宋文, 黄金霞, 刘毅, 汤怡洁. 面向知识发现的SKE关键技术及服务[J]. 现代图书情报技术, 2012, 28(7): 13-18.
[8] 王莉. 基于关键词链的动态分面研究[J]. 现代图书情报技术, 2012, 28(7): 76-81.
[9] 刘萍, 陈烨. 词汇相似度研究进展综述[J]. 现代图书情报技术, 2012, 28(7): 82-89.
[10] 朱雯晶, 夏翠娟. 二维码在图书馆移动服务中的应用——以上海图书馆为例[J]. 现代图书情报技术, 2012, 28(7): 115-120.
[11] 马健, 杜泽宇, 李树青. 基于多兴趣特征分析的图书馆个性化图书推荐方法[J]. 现代图书情报技术, 2012, 28(6): 1-8.
[12] 江华, 苏晓光. 无词典中文高频词快速抽取算法[J]. 现代图书情报技术, 2012, 28(6): 50-53.
[13] 薛建武, 白燚. 本体拓扑结构关系存储研究[J]. 现代图书情报技术, 2012, 28(5): 26-31.
[14] 肖晶, 梁冰, 张晓丹, 吕世炅. 一种面向篇级数据的作者名消歧规则和算法[J]. 现代图书情报技术, 2012, 28(5): 55-59.
[15] 李振清, 刘建毅, 王枞, 吴旭. 同行评议专家遴选系统研究与实现[J]. 现代图书情报技术, 2012, 28(5): 81-86.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn