Please wait a minute...
Advanced Search
现代图书情报技术  2013, Vol. 29 Issue (2): 50-56    DOI: 10.11925/infotech.1003-3513.2013.02.08
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于知识粒度的约简在Web使用挖掘中的应用研究
赵洁, 莫赞, 刘洪伟, 张沙清, 董振宁
广东工业大学管理学院 广州 510520
Web Usage Mining Using Reduction of Knowledge Granule
Zhao Jie, Mo Zan, Liu Hongwei, Zhang Shaqing, Dong Zhenning
School of Management, Guangdong University of Technology, Guangzhou 510520, China
全文: PDF(795 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 基于粒计算思想,构建多粒度的Web用户行为描述模型,然后使用基于知识粒度的约简算法对数据进行约简。实验数据证明,模型可描述多种粒度的用户行为特征,其中的总体行为描述模型有横向约简数据的效果,基于粒度原理的约简算法能更高效地对海量数据进行纵向约简,有效减轻后续模式分析的工作量。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
赵洁
莫赞
刘洪伟
张沙清
董振宁
关键词 Web使用挖掘多粒度约简    
Abstract:This paper proposes multi-granularity Web user behavior description model using granular theory, then the reduction algorithm based on knowledge granule is applied for the data. The experiment results prove that the model can not only descript multi-granularity user behavior characteristics, but also have the effect of horizontal dimension reduction. And efficient vertical dimension reduction is achieved by the reduction algorithm, which effectively reduce the work in the subsequent pattern analysis.
Key wordsWeb usage mining    Multi-granularity    Reduction
收稿日期: 2012-12-26     
:  TP393  
基金资助:本文系国家自然科学基金项目“面向隐私保护的移动商务推荐系统研究”(项目编号:70971027)、国家自然科学基金项目“网格环境下用户QoS需求驱动的移动服务资源选择优化研究”(项目编号:71171062)、教育部人文社会科学研究青年基金项目“基于粒计算的行为信任研究”(项目编号:10YJCZH234)、广东省自然科学博士启动基金项目“电子商务中交易实体的多粒度动态行为信任研究”(项目编号:S2011040004285)和广东省科技计划(软科学)基金资助项目“基于知识发现的广东LED照明产业技术创新决策支持研究”(项目编号:2011B070300112)的研究成果之一。
通讯作者: 赵洁,kitten-zj@163.com     E-mail: kitten-zj@163.com
引用本文:   
赵洁, 莫赞, 刘洪伟, 张沙清, 董振宁. 基于知识粒度的约简在Web使用挖掘中的应用研究[J]. 现代图书情报技术, 2013, 29(2): 50-56.
Zhao Jie, Mo Zan, Liu Hongwei, Zhang Shaqing, Dong Zhenning. Web Usage Mining Using Reduction of Knowledge Granule. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2013.02.08.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2013.02.08
[1] Nikulin V, McLachlan G J. Merging Algorithm to Reduce Dimensionality in Application to Web-Mining[C]. In: Proceedings of the 20th Australian Joint Conference on Advances in Artificial Intelligence(AI'07). Berlin, Heidelberg: Springer, 2007: 755-761.
[2] Hosseini M, Abolhassani H. Hierarchical Co-clustering for Web Queries and Selected URLs[C]. In: Proceedings of the 8th International Conference on Web Information Systems Engineering(WISE'07). Berlin, Heidelberg: Springer, 2007: 653-662.
[3] Song A B, Zhao M X, Liang Z P, et al. Discovering User Profiles for Web Personalized Recommendation[J]. Journal of Computer Science and Technology, 2004, 19(3): 320-328.
[4] 吴萍,宋瀚涛,牛振东,等. 基于 SS/OSF 实现高维稀疏数据对象的聚类[J]. 北京理工大学学报, 2006, 26(3): 216-220. (Wu Ping, Song Hantao, Niu Zhendong, et al. SS/OSF for High-Dimensional Sparse Data Object Clustering[J].Transactions of Beijing Institute of Technology, 2006, 26(3): 216-220.)
[5] Bedi P, Chawla S. Use of Fuzzy Rough Set Attribute Reduction in High Scent Web Page Recommendations[C]. In: Proceedings of the 12th International Conference on Rough Sets, Fuzzy Sets, Data Mining and Granular Computing(RSFDGrC'09). Berlin, Heidelberg: Springer, 2009: 192-200.
[6] 许建潮. Web 挖掘中若干问题的研究[D]. 长春:吉林大学, 2005.(Xu Jianchao. Some Studies for Web Mining[D]. Changchun: Jilin University, 2005. )
[7] Zadeh L A. Some Reflections on Soft Computing, Granular Computing and Their Roles in the Conception, Design and Utilization of Information/Intelligent Systems[J]. Soft Computing, 1998, 2(1): 23-25.
[8] 苗夺谦,王国胤,刘清,等. 粒计算: 过去, 现在与展望[M]. 北京:科学出版社, 2007.(Miao Duoqian, Wang Guoyin, Liu Qing, et al. Granular Computing: Past, Present and Prospects[M]. Beijing: Science Press, 2007.)
[9] 安秋生,沈钧毅,王国胤. 基于信息粒度与 Rough 集的聚类方法研究[J]. 模式识别与人工智能, 2003, 16(4): 412-417.(An Qiusheng, Shen Junyi, Wang Guoyin. A Clustering Method Based on Information Granularity and Rough Sets[J].Pattern Recognition and Artificial Intelligence, 2003, 16(4): 412-417.)
[10] 赵洁,董振宁,张沙清,等. 一种基于粒度原理的多指标综合 Web 用户聚类算法[J]. 计算机应用研究, 2011, 28(7): 2427-2431.(Zhao Jie, Dong Zhenning, Zhang Shaqing, et al. Granular Principle Based Multi-index Synthetical Web User Clustering Algorithm[J]. Application Research of Computers, 2011, 28(7):2427-2431.)
[11] 刘少辉,盛秋戬,吴斌,等. Rough 集高效算法的研究[J]. 计算机学报, 2003, 26(5): 524-529. (Liu Shaohui, Sheng Qiujian, Wu Bin, et al .Research on Efficient Algorithms for Rough Set Methods[J]. Chinese Journal of Computers,2003, 26(5): 524-529.)
[12] 赵洁,肖南峰. 一种基于知识颗粒的高效完备属性约简算法[J]. 中南大学学报:自然科学版, 2009, 40(6): 1623-1629.(Zhao Jie, Xiao Nanfeng. An Efficient and Complete Attribute Reduction Algorithm Based on Knowledge Granular[J]. Journal of Central South University Science and Technology,2009, 40(6): 1623-1629.)
[13] 宋江春,沈钧毅. 一种新的 Web 用户群体和 URL 聚类算法的研究[J]. 控制与决策, 2007, 22(3): 284-288.(Song Jiangchun, Shen Junyi. Research on a New Clustering Algorithm of Web User Communities and Web Site's URLs [J].Control and Decision, 2007, 22(3): 284-288.)
[14] 陈建斌. 高维聚类知识发现关键技术研究及应用[M]. 北京:电子工业出版社, 2009.(Chen Jianbin. Research and Application of Key Technologies in High-dimensional Clustering Knowledge Discovery[M]. Beijing: Publishing House of Electronics Industry,2009.)
[15] 赵亚琴,周献中,何新,等. 一种有效的高属性维稀疏数据聚类算法[J]. 模式识别与人工智能,2006, 19(3): 289-294.(Zhao Yaqin, Zhou Xianzhong, He Xin, et al. An Effective High Attribute Dimensional Sparse Clustering[J]. Pattern Recognition and Artificial Intelligence, 2006, 19(3): 289-294.)
[16] Xie Y, Raghavan V V, Dhatric P, et al. A New Fuzzy Clustering Algorithm for Optimally Finding Granular Prototypes[J]. International Journal of Approximate Reasoning, 2005, 40(1-2): 109-124.
[17] 赵洁,董振宁,张沙清,等. 一种多粒度 Web 使用数据收集方法[J]. 现代图书情报技术, 2011(2): 42-47. (Zhao Jie, Dong Zhenning, Zhang Shaqing, et al. A Collection Method for Multi-granularity Web Usage Data[J].New Technology of Library and Information Service, 2011(2): 42-47.)
[1] 周成,魏红芹. 基于随机森林属性约简的众包竞赛参与者识别体系研究*[J]. 数据分析与知识发现, 2018, 2(7): 46-54.
[2] 李湘东, 巴志超, 黄莉. 一种基于加权LDA模型和多粒度的文本特征选择方法[J]. 现代图书情报技术, 2015, 31(5): 42-49.
[3] 宋梅青. 面向协同过滤推荐的多粒度用户偏好挖掘研究[J]. 现代图书情报技术, 2015, 31(12): 28-33.
[4] 赵洁, 董振宁, 张沙清, 肖南峰. 一种多粒度Web使用数据收集方法[J]. 现代图书情报技术, 2011, 27(2): 42-47.
[5] 张志娟,刘新旺. 基于多粒度二元语义的SGML文件信息检索模型*[J]. 现代图书情报技术, 2007, 2(7): 27-31.
[6] 刘松 . 网络环境中个性化推荐系统研究*[J]. 现代图书情报技术, 2007, 2(4): 35-38.
[7] 白如江 . 基于粗糙集和RBF神经网络的文本自动分类方法[J]. 现代图书情报技术, 2006, 1(6): 47-51.
[8] 王媛媛,钟永恒 . 基于SQL Server 2005的Web日志挖掘系统构建[J]. 现代图书情报技术, 2006, 1(5): 58-61.
[9] 陶剑文 . 基于多Agent的智能推荐算法设计*[J]. 现代图书情报技术, 2006, 1(12): 49-53.
[10] 王效岳,白如江. 基于变精度粗糙集模型的Web文档分类方法[J]. 现代图书情报技术, 2005, 21(12): 51-54.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn