Please wait a minute...
Advanced Search
现代图书情报技术  2008, Vol. 24 Issue (8): 58-62     https://doi.org/10.11925/infotech.1003-3513.2008.08.10
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
基于UCL的网页信息自动标引技术研究*
沈静 周金治 马建国
(西南科技大学信息工程学院 绵阳 621010)
Research on the Auto Indexing Technology About Web Page Based on UCL
Shen Jing;Zhou Jinzhi;Ma Jianguo
 (School of Information Engineering of Southwest University of Science and Technology, Mianyang  621010,China)
全文: PDF (701 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

参照都柏林核心元数据规范构建网页信息的标引框架,提取网页特征信息,采用ADO技术实现网页信息的自动标引,实验结果表明,标引信息映射到网页的正确率为100%。最后,将标引技术应用到互补结构网络智能代理终端,验证UCL标引方法的有效性。实验结果显示,通过基于UCL的网页信息自动分类及标引技术能够实现信息的主动服务,满足用户的个性化需求。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
沈静
马建国
周金治
关键词 自动标引统一内容定位特征提取    
Abstract

 Indexing frame of Web page information is constructed referring to Dublin core metadata. Web page’s characteristic information is extracted. Web page information auto-indexing is realized by using ADO technology. The experiment result indicates that the accurate rate of mapping indexing information to Web page reaches 100%.Finally, classification and indexing technology are applied to the intelligent agent termination of the complementary architecture network. The effectiveness of UCL indexing method is proved. The experiment result indicates that  through Web page information auto-classification and auto-indexing technology based on the UCL, active service of information is realized and user’s individual demand is satisfied.

Key wordsAuto Indexing    UCL    Feature extracting
收稿日期: 2007-10-15      出版日期: 2008-08-25
ZTFLH: 

TP393.03

 
基金资助:

*本文系国家863计划项目“具有语义标引的互补结构网络”(项目编号:2005AA121520)及国家863计划项目“多层网络数据语义分类与理解技术研究”(项目编号:200701151)的研究成果之一。

通讯作者: 沈静     E-mail: shenjing8848@sina.com
作者简介: 沈静,周金治,马建国
引用本文:   
沈静,周金治,马建国. 基于UCL的网页信息自动标引技术研究*[J]. 现代图书情报技术, 2008, 24(8): 58-62.
Shen Jing,Zhou Jinzhi,Ma Jianguo. Research on the Auto Indexing Technology About Web Page Based on UCL. New Technology of Library and Information Service, 2008, 24(8): 58-62.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2008.08.10      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2008/V24/I8/58

[1] 文献信息检索网络信息检索[EB/OL].[2007-05-15].http://www.xauat.edu.cn/ex/tsinghua/software/12/05/001/01/00002/bjjc/wlxxjs/wlxxjs03.htm.
[2] 高杨,李幼平. UCL理论及其系统设计[J]. 电视技术,2001(2):38-41.
[3] 周金治,沈静,马建国. 局域网中的课件内容标引与主动服务[J]. 西南科技大学学报,2006,21(1):6-9.
[4] 沈静,周金治,马建国. 文化网格中的信息标引及其实现[J]. 电视技术,2007,31(3):46-48.
[5] 马建国.具有内容标引的信息共享技术[D].成都:电子科技大学,2004.
[6] 都柏林核心元素网站[EB/OL]. [2007-05-10].  http://dublincore.org.

[1] 熊欣,王昊,张海潮,张宝隆. 中文术语粒度对其区分能力测度的影响分析*[J]. 数据分析与知识发现, 2020, 4(2/3): 143-152.
[2] 李纲,周华阳,毛进,陈思菁. 基于机器学习的社交媒体用户分类研究 *[J]. 数据分析与知识发现, 2019, 3(8): 1-9.
[3] 文秀贤,徐健. 基于用户评论的商品特征提取及特征价格研究 *[J]. 数据分析与知识发现, 2019, 3(7): 42-51.
[4] 严娇,马静,房康. 基于融合共现距离的句法网络下文本语义相似度计算 *[J]. 数据分析与知识发现, 2019, 3(12): 93-100.
[5] 钟庆虹,乔晓东,张运良,翁梦娟. 基于LDA2Vec和残差网络的跨媒体融合方法研究 *[J]. 数据分析与知识发现, 2019, 3(10): 78-88.
[6] 杨贵军,徐雪,赵富强. 基于XGBoost算法的用户评分预测模型及应用*[J]. 数据分析与知识发现, 2019, 3(1): 118-126.
[7] 黄孝喜, 李晗雨, 王荣波, 王小华, 谌志群. 基于卷积神经网络与SVM分类器的隐喻识别*[J]. 数据分析与知识发现, 2018, 2(10): 77-83.
[8] 李伟卿, 王伟军. 基于大规模评论数据的产品特征词典构建方法研究*[J]. 数据分析与知识发现, 2018, 2(1): 41-50.
[9] 李昌兵, 庞崇鹏, 李美平. 基于权重的Apriori算法在文本统计特征提取方法中的应用*[J]. 数据分析与知识发现, 2017, 1(9): 83-89.
[10] 刘红光,马双刚,刘桂锋. 基于降噪自动编码器的中文新闻文本分类方法研究*[J]. 现代图书情报技术, 2016, 32(6): 12-19.
[11] 杜思奇, 李红莲, 吕学强. 汉语组块分析在产品特征提取中的应用研究[J]. 现代图书情报技术, 2015, 31(9): 26-30.
[12] 路永和, 梁明辉. 遗传算法在改进文本特征提取方法中的应用[J]. 现代图书情报技术, 2014, 30(4): 48-57.
[13] 唐晓波, 肖璐. 基于依存句法网络的文本特征提取研究[J]. 现代图书情报技术, 2014, 30(11): 31-37.
[14] 游贵荣, 吴为, 钱沄涛. 电子商务中垃圾评论检测的特征提取方法[J]. 现代图书情报技术, 2014, 30(10): 93-100.
[15] 杨贺, 杨奕虹, 李宁. 关键词-分类号关联词表构建[J]. 现代图书情报技术, 2013, 29(7/8): 107-113.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn