Please wait a minute...
Advanced Search
现代图书情报技术  2013, Vol. 29 Issue (3): 33-37     https://doi.org/10.11925/infotech.1003-3513.2013.03.06
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
面向汉语句法功能分布知识库的词汇类别知识挖掘研究
王东波1, 朱丹浩2
1. 南京农业大学信息科学技术学院 南京 210095;
2. 联合国大学国际软件技术研究所 澳门 3058
Research of Mining the Word Category Knowledge for Chinese Syntactic Function Distribution Knowledge Base
Wang Dongbo1, Zhu Danhao2
1. College of Information and Technology Science, Nanjing Agricultural University, Nanjing 210095, China;
2. International Institute for Software Technology, United Nations University, Macao 3058, China
全文: PDF (634 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 基于清华大学汉语树库,通过多叉树存储结构,构建汉语词汇的句法功能分布知识库。在构建的句法功能分布知识库基础上,利用Sparse Feature Clustering(SFC)中的K-medoids聚类算法,对汉语词汇的类别知识进行挖掘探究。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
王东波
朱丹浩
关键词 树库词汇句法功能知识库SFC    
Abstract:According to the Chinese word syntactic function distribution, the paper constructs syntactic function distribution knowledge in multi-way tree storage structure base based on Tsinghua treebank. The Chinese word category knowledge is mined by using the K-medoids clustering algorithm of Sparse Feature Clustering based on syntactic function distribution knowledge base.
Key wordsTreebank    Word syntactic function    Knowledge base    SFC
收稿日期: 2012-11-20      出版日期: 2013-05-14
:  TP391  
基金资助:本文系国家自然科学基金面上项目“面向知识服务的知识组织模式与应用研究”(项目编号:71273126)、高技术研究发展计划(863计划)“以科技文献服务为主的搜索引擎研制”(项目编号:2011AA01A206)和国家社会科学基金项目“基于语言特征的中文意见挖掘研究”(项目编号:11CYY031)的研究成果之一。
引用本文:   
王东波, 朱丹浩. 面向汉语句法功能分布知识库的词汇类别知识挖掘研究[J]. 现代图书情报技术, 2013, 29(3): 33-37.
Wang Dongbo, Zhu Danhao. Research of Mining the Word Category Knowledge for Chinese Syntactic Function Distribution Knowledge Base. New Technology of Library and Information Service, 2013, 29(3): 33-37.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2013.03.06      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2013/V29/I3/33
[1] 陈小荷.从自动句法分析角度看汉语词类问题[J]. 语言教学与研究 ,1999(3):63-72.(Chen Xiaohe. Chinese Words’Classes from the Perspective of Automatic Syntactic Analysis[J].Language Teaching and Research, 1999(3):63-72.)
[2] 徐艳华.现代汉语实词语法功能考察及词类体系重构[D].南京:南京师范大学,2006.(Xu Yanhua.Survey on Modern Chinese Notional Word Grammar Function and Reconstructing the POS System[D].Nanjing: Nanjing Normal University,2006.)
[3] 陈锋,陈小荷.基于树库的现代汉语短语分布考察[J]. 语言科学 ,2008, 7(1):12-17.(Chen Feng,Chen Xiaohe.A Study on Grammartical Functions of Phrases in Mandarin Chinese Based on Chinese TreeBank[J].Linguistic Sciences,2008, 7(1):12-17.)
[4] 卢俊之,陈小荷, 王东波, 等.基于语法功能匹配的汉语句法分析算法[J]. 计算机工程与应用 ,2008,44(16):151-153, 159.(Lu Junzhi,Chen Xiaohe, Wang Dongbo, et al.Chinese Parsing Algorithm Based on Grammar Function Match[J].Computer Engineering and Applications,2008,44(16):151-153,159.)
[5] 崔尚卿, 马秀莉, 唐世渭,等.基于不均匀密度的自动聚类算法[J]. 计算机工程 ,2008, 34(23):86-88.(Cui Shangqing, Ma Xiuli, Tang Shiwei, et al.Auto-clustering Algorithm Based on Non-uniform Density[J].Computer Engineering,2008, 34(23):86-88.)
[6] 王伟.文本自动聚类技术研究[J]. 情报杂志 ,2009, 28(2):94-96.(Wang Wei.Research on Text Automatic Clustering[J].Journal of Intelligence,2009,28(2):94-96.)
[7] 王舵, 郄君, 张娟, 等.一种快速词自动聚类算法[J]. 计算机应用与软件 ,2010, 27(8):277-278.(Wang Duo, Qie Jun, Zhang Juan, et al.A New Algorithm of Words Automatic Clustering[J].Computer Applications and Software,2010, 27(8):277-278.)
[8] 潘章明.半监督的自动聚类[J]. 计算机应用 ,2010, 30(10):2614-2617.(Pan Zhangming.Semi-supervised Automatic Clustering[J].Journal of Computer Applications, 2010, 30(10):2614-2617.)
[9] 于洪, 储双双.一种基于决策粗糙集的自动聚类方法[J]. 计算机科学 ,2011, 38(1):221-224.(Yu Hong, Chu Shuangshuang.Novel Autonomous Clustering Method Based on Decision-theoretic Rough Set[J].Computer Science,2011, 38(1):221-224.)
[10] Boley D, Gini M, Gross R, et al. Partitioning-based Clustering for Web Document Categorization[J]. Decision Support Systems, 1999, 27(3):329-341.
[11] Mao J, Jain A K. A Self-organizing Network for Hyperellipsoidal Clustering [J]. IEEE Transactions on Neural Networks, 1996, 7(1):16-29.
[12] Cai W, Chen S, Zhang D. Fast and Robust Fuzzy C-means Clustering Algorithms Incorporating Local Information for Image Segmentation[J]. Pattern Recognition, 2007, 40(3):825-838.
[13] Chen H H, Lin C J. A Multilingual News Summarizer[C]. In: Proceedings of the 18th International Conference on Computational Linguistics. Stroudsburg: Association for Computational Linguistics, 2000:159-165.
[14] Leftin L J.Newsblaster Russian-English Clustering Performance Analysis[R].Columbia Computer Science Technical Reports, 2003.
[15] Evans D K,Klavans J L,McKeown K R.Columbia Newsblaster: Multilingual News Summarization on the Web Demonstration[C].In: Proceedings of HLT-NAACL 2004. Stroudsburg: Association for Computational Linguistics, 2004:1-4.
[16] Mathieu B, Besancon R, Fluhr C. Multilingual Document Clusters Discovery[C]. In: Proceedings of RIAO 2004. 2004:116-125.
[17] 周强, 张伟, 俞士汶.汉语树库的构建[J]. 中文信息学报 ,1997(4):42-51. (Zhou Qiang,Zhang Wei,Yu Shiwen.Building a Chinese Treebank[J].Journal of Chinese Information Processing,1997(4): 42-51.)
[18] Dhillon I S, Mallela S, Kumar R.A Divisive Information Theoretic Feature Clustering Algorithm for Text Classification[J].The Journal of Machine Learning Research,2003,3(1):1265-1287.
[19] Marcus M P,Marcinkiewicz M A,Santorini B.Building a Large Annotated Corpus of English: The Penn Treebank[J].Computational Linguistics,1993,19(2):313-330.
[1] 李文娜,张智雄. 基于置信学习的知识库错误检测方法研究*[J]. 数据分析与知识发现, 2021, 5(9): 1-9.
[2] 卢利农,祝忠明,张旺强,王小春. 基于Lingo3G聚类算法的机构知识库跨库知识整合与知识指纹服务实现[J]. 数据分析与知识发现, 2021, 5(5): 127-132.
[3] 温萍梅,叶志炜,丁文健,刘颖,徐健. 命名实体消歧研究进展综述*[J]. 数据分析与知识发现, 2020, 4(9): 15-25.
[4] 祁瑞华,周俊艺,郭旭,刘彩虹. 基于知识库的图书评论主题抽取研究*[J]. 数据分析与知识发现, 2019, 3(6): 83-91.
[5] 张旺强,祝忠明,李雅梅,卢利农,刘巍. 机构知识库作者名自动消歧框架设计与实践*[J]. 数据分析与知识发现, 2019, 3(6): 92-98.
[6] 吴志强,祝忠明,刘巍,王思丽. CSpace知识分析与可视化功能扩展研究与实践*[J]. 数据分析与知识发现, 2019, 3(3): 112-119.
[7] 吴志强, 祝忠明, 姚晓娜, 王思丽. CSpace机构知识库影音资源支持能力扩展研究与实践*[J]. 数据分析与知识发现, 2017, 1(9): 90-96.
[8] 陈果, 肖璐. 网络社区中的知识元链接体系构建研究*[J]. 数据分析与知识发现, 2017, 1(11): 75-83.
[9] 王思丽, 刘巍, 祝忠明, 吴志强, 王金平. 基于CSpace的科技信息可配置化自动监测功能设计与实现*[J]. 数据分析与知识发现, 2017, 1(10): 85-93.
[10] 吴志强, 祝忠明, 刘巍, 张旺强, 姚晓娜. 机构知识库三维模型检索与展示技术研究与实践*[J]. 数据分析与知识发现, 2017, 1(1): 73-80.
[11] 周鹏程,武川,陆伟. 基于多知识库的短文本实体链接方法研究*——以Wikipedia和Freebase为例[J]. 现代图书情报技术, 2016, 32(6): 1-11.
[12] 张旺强,祝忠明,姚晓娜,刘巍. 基于开放获取论文推送转发服务系统iSwitch的机构知识库内容建设*[J]. 现代图书情报技术, 2016, 32(4): 91-96.
[13] 刘峰,黎建辉,张进,韩芳,刘昂. TeamDR:面向科研团队的数据知识库管理系统*[J]. 现代图书情报技术, 2016, 32(3): 82-89.
[14] 翟东升, 刘鹤, 张杰, 蔡力伟. 基于图形数据库的专利语义知识库构建技术研究[J]. 数据分析与知识发现, 2016, 32(12): 66-75.
[15] 钱力, 师洪波, 张晓林, 梁娜. 开放获取论文推送转发服务系统iSwitch: 论文分发推送[J]. 现代图书情报技术, 2015, 31(6): 7-12.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn