Please wait a minute...
Advanced Search
现代图书情报技术  2011, Vol. 27 Issue (2): 42-47     https://doi.org/10.11925/infotech.1003-3513.2011.02.07
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
一种多粒度Web使用数据收集方法
赵洁1,2, 董振宁1, 张沙清1, 肖南峰2
1. 广东工业大学管理学院 广州 510520;
2. 华南理工大学计算机科学与工程学院 广州 510641
A Collection Method for Multi-granularity Web Usage Data
Zhao Jie1,2, Dong Zhenning1, Zhang Shaqing1, Xiao Nanfeng2
1. School of Management, Guangdong University of Technology, Guangzhou 510520, China;
2. School of Computer Science & Engineering, South China University of Technology, Guangzhou 510641, China
全文: PDF (732 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

提出一种多粒度的用户行为数据收集方法,该方法以可配置的插件形式嵌入服务器端收集数据。实验证明,该方法能提高Web使用挖掘的数据质量,简化Web使用挖掘预处理工作,并为后续挖掘工作提供多种粒度的信息,从而为分析Web用户的行为提供优质数据源。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
赵洁
董振宁
张沙清
肖南峰
关键词 Web使用挖掘数据收集多粒度    
Abstract

This paper proposes a new multi-granularity collection method for user behavior data which collects data through configurable server plug-in. The experiment results prove that the method can enhance quantity of Web usage mining data, simplify data cleaning and give multi-granularity information for the following mining,and provide high quality data for Web user behavior analysis.

Key wordsWeb usage mining    Data collection    Multi-granularity
收稿日期: 2010-12-20      出版日期: 2011-03-25
: 

TP393

 
基金资助:

本文系教育部人文社会科学研究青年基金项目“基于粒计算的行为信任研究”(项目编号:10YJCZH234)、广东高校优秀青年创新人才培养计划(育苗工程)项目“基于粒计算的Web使用挖掘算法研究”(项目编号:100070)、广东工业大学博士启动基金“基于粒计算的行为信任研究”(项目编号:103055)的研究成果之一。

引用本文:   
赵洁, 董振宁, 张沙清, 肖南峰. 一种多粒度Web使用数据收集方法[J]. 现代图书情报技术, 2011, 27(2): 42-47.
Zhao Jie, Dong Zhenning, Zhang Shaqing, Xiao Nanfeng. A Collection Method for Multi-granularity Web Usage Data. New Technology of Library and Information Service, 2011, 27(2): 42-47.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2011.02.07      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2011/V27/I2/42


[1] Srivastava J,Cooley R, Deshpande M, et al.Web Usage Mining: Discovery and Applications of Usage Patterns from Web Data
[J].SIGKDD Explorations, 2000,1(2):12-23.

[2] Barth M, Skubacz M, Stolz C. Web Performance Indicator by Implicit User Feedback - Application and Formal Approach . In: Proceedings of the 6th International Conference on Web Information Systems Engineering, Web Information Systems Engineering – WISE 2005. Berlin: Springer, 2005:689-700.

[3] Cooley R, Mobasher B, Srivastava J. Data Preparation for Mining World Wide Web Browsing Patterns
[J].Journal of Knowledge and Information Systems,1999,1(1):5-32.

[4] 阮备军. Web使用挖掘中若干关键问题研究 . 上海:复旦大学,2004.

[5] 刘立军,周军,梅红岩. Web使用挖掘的数据预处理
[J]. 计算机科学 , 2007,34(5):200-201,204.

[6] 邢东山,沈钧毅.Web使用挖掘的数据采集
[J]. 计算机工程 , 2002,28(1):39-41.

[7] Araya S, Silva M, Weber R. A Methodology for Web Usage Mining and Its Application to Target Group Identification
[J]. Fuzzy Sets and Systems, 2004,148(1):139-152.

[8] Tao Y H, Hong T P, Su Y M.Web Usage Mining with Intentional Browsing Data
[J]. Expert Systems with Applications: An International Journal, 2008,34(3): 1893-1904.

[9] Tao Y H, Hong T P, Lin W H. A Practical Extension of Web Usage Mining with Intentional Browsing Data Toward Usage
[J]. Expert Systems with Applications: An International Journal,2009,36(2):3937-3945.

[10] Kim H K, Lee R Y. Frameworks for Web Usage Mining . //Studies in Computational Intelligence
[M]. Berlin,Heidelberg: Springer,2009:121-134.

[11] 郭岩,白硕,于满泉.Web使用信息挖掘综述
[J]. 计算机科学 ,2005,32(1):1-7.

[12] Liu H B, Keelj V. Combined Mining of Web Server Logs and Web Contents for Classifying User Navigation Patterns and Predicting Users’ Future Requests
[J]. Data & Knowledge Engineering, 2007,61(2):304-330.

[13] Wang X, Li B W. Intelligent Knowledge Recommendation System Based on Web Log and Cache Data
[J]. Lecture Notes in Computer Science, 2006,4181:48-56.

[14] Inuzuka N, Hayakawa J I. A Unified Approach to Web Usage Mining Based on Frequent Sequence Mining . In: Proceedings of KES’07 Knowledge-Based Intelligent Information and Engineering Systems and the XVII Italian Workshop on Neural Networks. Heidelberg,Berlin: Springer-Verlag,2007:987-994.

[15] Perugini S,Ramakrishnan N. Mining Web Functional Dependencies for Flexible Information Access
[J]. Journal of the American Society for Information Science and Technology,2007,58(12):1805-1819.

[16] 赵洁,肖南峰,钟军锐. 基于贝叶斯网络和行为日志挖掘的行为信任控制
[J]. 华南理工大学学报:自然科学版 ,2009, 37(5):94-100.

[17] 赵洁,肖南峰,钟军锐.Web使用挖掘在信任管理中的应用
[J]. 计算机工程 ,2009,35(24):33-35, 38.

[1] 李湘东, 巴志超, 黄莉. 一种基于加权LDA模型和多粒度的文本特征选择方法[J]. 现代图书情报技术, 2015, 31(5): 42-49.
[2] 宋梅青. 面向协同过滤推荐的多粒度用户偏好挖掘研究[J]. 现代图书情报技术, 2015, 31(12): 28-33.
[3] 赵洁, 莫赞, 刘洪伟, 张沙清, 董振宁. 基于知识粒度的约简在Web使用挖掘中的应用研究[J]. 现代图书情报技术, 2013, 29(2): 50-56.
[4] 张志娟,刘新旺. 基于多粒度二元语义的SGML文件信息检索模型*[J]. 现代图书情报技术, 2007, 2(7): 27-31.
[5] 刘松 . 网络环境中个性化推荐系统研究*[J]. 现代图书情报技术, 2007, 2(4): 35-38.
[6] 王媛媛,钟永恒 . 基于SQL Server 2005的Web日志挖掘系统构建[J]. 现代图书情报技术, 2006, 1(5): 58-61.
[7] 陶剑文 . 基于多Agent的智能推荐算法设计*[J]. 现代图书情报技术, 2006, 1(12): 49-53.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn