Please wait a minute...
Advanced Search
现代图书情报技术  2002, Vol. 18 Issue (6): 38-40     https://doi.org/10.11925/infotech.1003-3513.2002.06.14
  信息检索技术 本期目录 | 过刊浏览 | 高级检索 |
Web文本挖掘浅析
王连军 
 (南京大学信息管理系   南京 210093)
An Analysis on Web-Based Text Mining
Wang Lianjun
(Department of Information Management,Nanjing University,Nanjing 210093,China)
全文:
输出: BibTeX | EndNote (RIS)      
摘要 

首先讨论Web挖掘与Web信息检索的关系,然后重点分析Web文本挖掘,并提出Web文本挖掘的方法,包括文本特征表示、文本分类和文本聚类。最后,提出了利用Web挖掘技术实现Web智能化服务和挖掘引擎的应用。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 Web文本挖掘文本分类文本聚类信息检索    
Abstract

The relationships between Web-based mining and information retrieving were discussed, and ways of Web-based text mining were put on emphasis. These ways included choices of text characters, text classification and text clustering. Finally, two applications of Web-based text mining were offered.

Key wordsWeb    Text mining    Text classification    Text clustering    Information retrieving
收稿日期: 2002-08-28      出版日期: 2002-12-25
ZTFLH: 

G250.75 

 
     
  G352

 
通讯作者: 王连军   
作者简介: 王连军
引用本文:   
王连军. Web文本挖掘浅析[J]. 现代图书情报技术, 2002, 18(6): 38-40.
Wang Lianjun. An Analysis on Web-Based Text Mining. New Technology of Library and Information Service, 2002, 18(6): 38-40.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2002.06.14      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2002/V18/I6/38

[1] 苏新宁等.信息传播技术.南京:南京大学出版社,1998,(4)
[2] 王继成等.Web文本挖掘技术研究.计算机研究与发展,2001,(5)
[3] 李凡等.关于文本特征抽取新方法的研究.清华大学学报,2001,(7)
[4] 卢正鼎等.利用文本挖掘实现Web智能服务.小型微型计算机系统,2001,(6)
[5] 韩客松等.文本挖掘、数据挖掘和知识管理.情报学报,2001,(2)
[6] 王实等.Web数据挖掘.计算机科学,2000,(4)
[7] 韩家炜等.Web挖掘研究.计算机研究与发展,2001,(4)

[1] 陈杰,马静,李晓峰. 融合预训练模型文本特征的短文本分类方法*[J]. 数据分析与知识发现, 2021, 5(9): 21-30.
[2] 周泽聿,王昊,赵梓博,李跃艳,张小琴. 融合关联信息的GCN文本分类模型构建及其应用研究*[J]. 数据分析与知识发现, 2021, 5(9): 31-41.
[3] 黄名选,蒋曹清,卢守东. 基于词嵌入与扩展词交集的查询扩展*[J]. 数据分析与知识发现, 2021, 5(6): 115-125.
[4] 余本功,朱晓洁,张子薇. 基于多层次特征提取的胶囊网络文本分类研究*[J]. 数据分析与知识发现, 2021, 5(6): 93-102.
[5] 孟镇,王昊,虞为,邓三鸿,张宝隆. 基于特征融合的声乐分类研究*[J]. 数据分析与知识发现, 2021, 5(5): 59-70.
[6] 许光,任明,宋城宇. 西方媒体新闻中的中国经济形象提取*[J]. 数据分析与知识发现, 2021, 5(5): 30-40.
[7] 李跃艳,王昊,邓三鸿,王伟. 近十年信息检索领域的研究热点与演化趋势研究——基于SIGIR会议论文的分析[J]. 数据分析与知识发现, 2021, 5(4): 13-24.
[8] 代冰,胡正银. 基于文献的知识发现新近研究综述 *[J]. 数据分析与知识发现, 2021, 5(4): 1-12.
[9] 王艳, 王胡燕, 余本功. 基于多特征融合的中文文本分类研究*[J]. 数据分析与知识发现, 2021, 5(10): 1-14.
[10] 余传明, 王曼怡, 林虹君, 朱星宇, 黄婷婷, 安璐. 基于深度学习的词汇表示模型对比研究*[J]. 数据分析与知识发现, 2020, 4(8): 28-40.
[11] 夏天. 面向中文学术文本的单文档关键短语抽取 *[J]. 数据分析与知识发现, 2020, 4(7): 76-86.
[12] 唐晓波,高和璇. 基于关键词词向量特征扩展的健康问句分类研究 *[J]. 数据分析与知识发现, 2020, 4(7): 66-75.
[13] 王思迪,胡广伟,杨巳煜,施云. 基于文本分类的政府网站信箱自动转递方法研究*[J]. 数据分析与知识发现, 2020, 4(6): 51-59.
[14] 徐月梅,刘韫文,蔡连侨. 基于深度融合特征的政务微博转发规模预测模型*[J]. 数据分析与知识发现, 2020, 4(2/3): 18-28.
[15] 马建霞,袁慧,蒋翔. 基于Bi-LSTM+CRF的科学文献中生态治理技术相关命名实体抽取研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 78-88.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn