Please wait a minute...
Advanced Search
现代图书情报技术  2006, Vol. 1 Issue (2): 5-9     https://doi.org/10.11925/infotech.1003-3513.2006.02.02
  数字图书馆 本期目录 | 过刊浏览 | 高级检索 |
一种基于数字图书馆的文本信息标引技术的改进研究*
王兰成王立双2
1(南京政治学院上海分院军事信息管理系 上海 200433)
2(万方数据股份有限公司 北京 100044)
Research on a New Text Automatic Indexing Technology Based on Digital Library
Wang Lancheng1   Wang Lishuang2
1(Department of Information Management, Nanjing Political College PLA, Shanghai 200433, China)
2(Wanfang Data Co., Ltd, Beijing 100044, China)
全文: PDF (0 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

研究构建了具有位置信息控制的特义禁用词语义环境,进而运用于中文文献元数据CXMARC文本的自动标引和主题信息的数据挖掘,其中研究设计的预处理特义中文禁用字词切分算法SWF,能有效地减少领域的分词歧义性和缩短标引时间,从而改进了传统最大匹配MM算法的自动标引质量和效率。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
王兰成
王立双
关键词 自动标引数字图书馆中文信息处理MARC文本    
Abstract

The semantic environmental with  special stop-words location information control has been studied and founded. This technology has been applied to Chinese metadata CXMARC text automatic indexing and the data mining of theme information. The algorithm of SWF that is used in the pretreatment special Chinese text automatic indexing can reduce the participle different meanings of a field efficiently and shorten indexing time. So tradition maximum matching algorithm has been improved of its quality and efficiency.

Key wordsAutomatic indexing    Digital library    Chinese information processing    MARC
收稿日期: 2005-09-13      出版日期: 2005-02-25
ZTFLH: 

G254.36

 
基金资助:

*本文系第19届全国计算机信息管理学术研讨会论文和国家社会科学基金项目(项目编号:05BTQ011)研究成果之一。

通讯作者: 王兰成      E-mail: wanglancheng@163.com
作者简介: 王兰成,王立双
引用本文:   
王兰成,王立双. 一种基于数字图书馆的文本信息标引技术的改进研究*[J]. 现代图书情报技术, 2006, 1(2): 5-9.
Wang Lancheng,Wang Lishuang. Research on a New Text Automatic Indexing Technology Based on Digital Library. New Technology of Library and Information Service, 2006, 1(2): 5-9.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2006.02.02      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2006/V1/I2/5

1 J.F.Martinez-Trinidad. A Tool To Discover The Main Themes. In A Spanish Or English Document,Expert System With Applications,2000,319-327
2 Wolff J E,et al.. Searching and browsing collections of structural information,In:Proc. of the IEEE Advances in Digital Libraries,2000,141-150
3 W.S.Cooper, A.Chen, F.Gey. Experiments in Probabilistic Retrieval of Full Text Documents, Text Retrieval Conference,Gaithersburg,MD, U.S.A., 1994,127-134
4 SaltonG.. Another look at automatic Text Retrieval  systems,Communications of ACM,1986,29(7):236-250
5 Gaston H Gonnet, Ricardo A. Baeza-yates and Tim Sinder. New indices for Text:PAT trees and PAT arrays. Information Retrieval Data Structures & Algorithms, Prentice Hall, 1992
6 Fan Jang-Jong, Su Keh-Yih. An efficient algorithm for match multiple patterns. IEEE Trans on Knowledge and Data Engineering, 1993, 5(2):339-351
7 王兰成等.  PLS:一种基于信息自动标引的最小推进分词算法及其实现,计算机科学,2002(增刊):24-26
8 田梅.  档案机读目录XML描述及其主题信息自动标引的研究:[学位论文].上海:南京政治学院上海分院信息管理系,2004

[1] 熊欣,王昊,张海潮,张宝隆. 中文术语粒度对其区分能力测度的影响分析*[J]. 数据分析与知识发现, 2020, 4(2/3): 143-152.
[2] 齐云飞, 赵宇翔, 朱庆华. 关联数据在数字图书馆移动视觉搜索系统中的应用研究*[J]. 数据分析与知识发现, 2017, 1(1): 81-90.
[3] 洪亮,钱晨,樊星. 移动数字图书馆资源的情境感知个性化推荐方法研究*[J]. 现代图书情报技术, 2016, 32(7-8): 110-119.
[4] 刘健,毕强,马卓. 数字图书馆微服务评价指标体系构建及实证研究*[J]. 现代图书情报技术, 2016, 32(5): 22-29.
[5] 段宇锋,黄思思. 中文植物物种多样性描述文本的信息抽取研究*[J]. 现代图书情报技术, 2016, 32(1): 87-96.
[6] 王传清, 毕强. 数字图书馆自动化语义标注工具系统模型研究[J]. 现代图书情报技术, 2014, 30(6): 17-24.
[7] 尉萌. 利用演化模式做文献推荐[J]. 现代图书情报技术, 2014, 30(4): 20-26.
[8] 胡昌平, 陈果. 共词分析中的词语贡献度特征选择研究[J]. 现代图书情报技术, 2013, 29(7/8): 89-93.
[9] 杨贺, 杨奕虹, 李宁. 关键词-分类号关联词表构建[J]. 现代图书情报技术, 2013, 29(7/8): 107-113.
[10] 王忠义, 夏立新, 石义金, 郑森茂. 数字图书馆中层关联数据的创建与发布[J]. 现代图书情报技术, 2013, (5): 28-33.
[11] 刘炜, 夏翠娟, 张春景. 大数据与关联数据:正在到来的数据技术革命[J]. 现代图书情报技术, 2013, (4): 2-9.
[12] 周姗姗, 毕强, 高俊峰. 基于社会网络分析的信息检索结果可视化呈现方法研究[J]. 现代图书情报技术, 2013, 29(11): 81-85.
[13] 邓莎莎, 张朋柱, 李欣苗. 政府公共决策领域中网络民意建模方法研究[J]. 现代图书情报技术, 2012, (9): 69-74.
[14] 陈俊杰, 黄国凡. 移动图书馆APP的构建策略和关键技术——以iOS为例[J]. 现代图书情报技术, 2012, (9): 75-80.
[15] 董丽, 曾婷, 陈武, 姜爱蓉. 2011年亚太数字图书馆会议(ICADL 2011)综述[J]. 现代图书情报技术, 2012, 28(7): 33-39.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn