一种基于本体论和潜在语义索引的文本语义处理方法*

doi:10.11925/infotech.1003-3513.2006.09.08

现代图书情报技术

2006, Vol. 1

Issue (9): 34-37 https://doi.org/10.11925/infotech.1003-3513.2006.09.08

信息检索技术

本期目录 | 过刊浏览 | 高级检索

一种基于本体论和潜在语义索引的文本语义处理方法*

秦春秀刘怀亮赵捧未

（西安电子科技大学经济管理学院西安 710071）

A Text Semantic Information Processing Method Based on Ontology and Latent Semantic Indexing

Qin Chunxiu Liu Huailiang Zhao Pengwei

(School of Economics and Management, Xidian University， Xi’an 710071,China)

摘要
参考文献
相关文章
Metrics

全文:
输出: BibTeX | EndNote (RIS)

摘要

提出一种基于潜在语义索引和本体论的文本语义处理方法。首先构建一个基于本体论的虚拟标准文本特征向量，然后采用潜在语义索引方法以虚拟标准文本特征向量为参照对文本集进行语义聚类，最后在虚拟标准文本特征向量的导引下利用本体库中的知识对聚类获得的文本集合的类别和语义进行显性标注。实验表明，该方法能较好地在语义层面对文本进行有效的聚类，而且聚类结果能显性地显示类聚所属的类别。

	服务

	把本文推荐给朋友
	加入引用管理器
	E-mail Alert
	RSS
	作者相关文章
	秦春秀
	赵捧未
	刘怀亮

关键词 ：潜在语义索引, 本体论, 文本聚类, 语义, 标注

Abstract：

This paper presents a method for text semantic information processing based on Ontology and latent semantic indexing. Firstly, virtual standard text characteristic vectors are constructed; then, the texts are semantically classified into document sets according to virtual standard text characteristic vectors by using latent semantic indexing method; finally, semantically explicit annotations to the document sets are abtained from Ontology-base by guidance of virtual standard text characteristic vectors. Experiments show that method can achieve good text clustering of semantic level, and the clustering can explicitly indicate categories of the clustered documents.

Key words： Latent semantic indexing Ontology Clustering Semantics Annotation

收稿日期: 2006-06-20 出版日期: 2006-09-25

G354.2

基金资助:

*本文系国家自然科学基金项目“基于语义网的多媒体知识元发现与挖掘”(项目编号：70503022)的研究成果之一。

通讯作者: 秦春秀 E-mail: qinchx@126.com

作者简介: 秦春秀,刘怀亮,赵捧未

引用本文:

秦春秀,刘怀亮,赵捧未 . 一种基于本体论和潜在语义索引的文本语义处理方法*[J]. 现代图书情报技术, 2006, 1(9): 34-37.
Qin Chunxiu,Liu Huailiang,Zhao Pengwei . A Text Semantic Information Processing Method Based on Ontology and Latent Semantic Indexing. New Technology of Library and Information Service, 2006, 1(9): 34-37.

链接本文:

https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2006.09.08 或 https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2006/V1/I9/34

1张晓林.Semantic Web与基于语义的网络信息检索.情报学报，2002，21(4):413-420
2Berry M W, Dumais S T, O. brien G W. Using linear algebra for intelligent information retrieval, SIAM Review, 1995, 37(4):573-595
3Deerwester S, Dumais S T, Furnas G W et al.Indexing by Latent Semantic Analysis， Journal of the American Society for Information Science, 1990, 41(6):391-407
4Neches R, Fikes R E, Gruber T R, et al. Enabling Technology for Knowledge Sharing.AI Magazine, 1991, 12(3):36-56
5W. N. Borst. Construction of Engineering Ontologies for Knowledge Sharing and Reuse. PhD thesis, University of Twente, Enschede, 1997
6林鸿飞，姚天顺.基于潜在语义索引的文本浏览机制.中文信息学报, 2000, 14(5):49-56
7杨梁彬.文本检索的潜在语义索引法初探.大学图书馆学报,2003(6):68-74,84

[1]	王一钒,李博,史话,苗威,姜斌. 古汉语实体关系联合抽取的标注方法*[J]. 数据分析与知识发现, 2021, 5(9): 63-74.
[2]	李文娜, 张智雄. 基于联合语义表示的不同知识库中的实体对齐方法研究*[J]. 数据分析与知识发现, 2021, 5(7): 1-9.
[3]	徐峥,乐小虬. 类目式文档语义特征AND-OR逻辑表达式生成方法[J]. 数据分析与知识发现, 2021, 5(5): 95-103.
[4]	张国标,李洁. 融合多模态内容语义一致性的社交媒体虚假新闻检测^*[J]. 数据分析与知识发现, 2021, 5(5): 21-29.
[5]	石湘,刘萍. *基于知识元语义描述模型的领域知识抽取与表示研究 ^——以信息检索领域为例**[J]. 数据分析与知识发现, 2021, 5(4): 123-133.
[6]	张琪,江川,纪有书,冯敏萱,李斌,许超,刘浏. 面向多领域先秦典籍的分词词性一体化自动标注模型构建^*[J]. 数据分析与知识发现, 2021, 5(3): 2-11.
[7]	张金柱, 于文倩. 基于短语表示学习的主题识别及其表征词抽取方法研究[J]. 数据分析与知识发现, 2021, 5(2): 50-60.
[8]	邵琦,牟冬梅,王萍,靳春妍. 基于语义的突发公共卫生事件网络舆情主题发现研究^*[J]. 数据分析与知识发现, 2020, 4(9): 68-80.
[9]	魏庭新,柏文雷,曲维光. 词向量和语义知识相结合的汉语未登录词语义预测研究*[J]. 数据分析与知识发现, 2020, 4(6): 109-117.
[10]	叶佳鑫,熊回香,童兆莉,孟秋晴. 在线医疗社区中面向医生的协同标注研究*[J]. 数据分析与知识发现, 2020, 4(6): 118-128.
[11]	于丰畅,陆伟. 一种学术文献图表位置标注数据集构建方法[J]. 数据分析与知识发现, 2020, 4(6): 35-42.
[12]	邓思艺,乐小虬. 基于动态语义注意力的指代消解方法[J]. 数据分析与知识发现, 2020, 4(5): 46-53.
[13]	朱路,田晓梦,曹赛男,刘媛媛. 基于高阶语义相关的子空间跨模态检索方法研究^*[J]. 数据分析与知识发现, 2020, 4(5): 84-91.
[14]	张冬瑜,崔紫娟,李映夏,张伟,林鸿飞. 基于Transformer和BERT的名词隐喻识别*[J]. 数据分析与知识发现, 2020, 4(4): 100-108.
[15]	张润彤,陈东华,赵红梅,朱晓敏. 基于中文语义分析的计算机辅助ICD-11编码方法研究*[J]. 数据分析与知识发现, 2020, 4(4): 44-55.

Viewed

Full text

Abstract

Cited

Shared

Discussed