Please wait a minute...
Advanced Search
现代图书情报技术  2006, Vol. 1 Issue (5): 62-64     https://doi.org/10.11925/infotech.1003-3513.2006.05.16
  网络资源与建设 本期目录 | 过刊浏览 | 高级检索 |
基于XML的Web日志挖掘研究*
潘有能
(浙江大学信息资源管理系 杭州 310028)
Web Usage Mining Research Based on XML
Pan Youneng
(Department of Information Resources Management, Zhejiang University, Hangzhou 310028,China)
全文:
输出: BibTeX | EndNote (RIS)      
摘要 

设计一个基于XML的Web日志挖掘体系结构,简要介绍XGMML和LOGML,并在此基础上讨论LOGML文档的生成方法及利用Apriori算法对日志文档进行频繁集、频繁序列和频繁子图挖掘。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
潘有能
关键词 数据挖掘Web日志XML    
Abstract

This paper builds a framework of Web usage mining based on XML technology, introduces XGMML and LOGML briefly. Then, the author discusses the method to generate LOGML documents. At last, the Apriori algorithm was used to mine frequent sets, frequent sequences and frequent sub-graphic in Web usage documents.

Key wordsData mining    Web usage data    XML
收稿日期: 2006-02-16      出版日期: 2006-05-25
: 

TP311

 
基金资助:

*本文系浙江大学“曙光”青年项目“基于XML的Web日志挖掘研究”(项目编号:205000-362221)的研究成果之一。

通讯作者: 潘有能      E-mail: ynpan@zju.edu.cn
作者简介: 潘有能
引用本文:   
潘有能 . 基于XML的Web日志挖掘研究*[J]. 现代图书情报技术, 2006, 1(5): 62-64.
Pan Youneng . Web Usage Mining Research Based on XML. New Technology of Library and Information Service, 2006, 1(5): 62-64.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2006.05.16      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2006/V1/I5/62

1Facca, Federico Michele, Lanzi, Pier Luca. Mining interesting knowledge from weblogs: a survey. Data & Knowledge Engineering, 2005, 53(3): 225-241
2John R. Punin, Mukkai S. Krishnamoorthy, Mohammed J. Zaki. LOGML: Log Markup Language for Web Usage Mining. WWW10 Conference, 2001
3John Punin, Mukkai Krishnamoorthy. WWWPal System——A System for Analysis and Synthesis of Web Pages. WebNet 98 Conference, 1998
4赵红玲, 宋瀚涛, 牛振东, 刘桂山. Web日志挖掘中数据预处理的研究. 计算机应用研究, 2005, 22(6): 67-69
5潘有能, 邓三鸿. 基于XML和关联规则的Web挖掘研究. 现代图书情报技术, 2004(7): 30-34
6史忠植著. 知识发现. 北京: 清华大学出版社, 2002

[1] 谢旺, 王丽珍, 陈红梅, 曾兰清. 基于空间序偶模式挖掘污染源与癌症病例的关系 *[J]. 数据分析与知识发现, 2021, 5(2): 14-31.
[2] 张勇,李树青,程永上. 基于频次有效长度的加权关联规则挖掘算法研究 *[J]. 数据分析与知识发现, 2019, 3(7): 85-93.
[3] 陆泉,朱安琪,张霁月,陈静. 中文网络健康社区中的用户信息需求挖掘研究*——以求医网肿瘤板块数据为例[J]. 数据分析与知识发现, 2019, 3(4): 22-32.
[4] 牟冬梅,法慧,王萍,孙晶. 基于结构方程模型的疾病危险因素研究*[J]. 数据分析与知识发现, 2019, 3(4): 80-89.
[5] 李勇男. 贝叶斯理论在反恐情报分类分析中的应用研究*[J]. 数据分析与知识发现, 2018, 2(10): 9-14.
[6] 牟冬梅, 王萍, 赵丹宁. 高维电子病历的数据降维策略与实证研究*[J]. 数据分析与知识发现, 2018, 2(1): 88-98.
[7] 胡忠义, 王超群, 吴江. 融合多源网络评估数据及URL特征的钓鱼网站识别技术研究*[J]. 数据分析与知识发现, 2017, 1(6): 47-55.
[8] 江思伟, 谢振平, 陈梅婕, 蔡明. 混合特征数据的自解释归约建模方法*[J]. 数据分析与知识发现, 2017, 1(12): 92-100.
[9] 牟冬梅,任珂. 三种数据挖掘算法在电子病历知识发现中的比较*[J]. 现代图书情报技术, 2016, 32(6): 102-109.
[10] 李峰,李书宁,于静. 面向院系的高校毕业生图书馆记忆系统[J]. 现代图书情报技术, 2016, 32(5): 99-103.
[11] 赵静娴. 基于决策树的网络伪舆情识别研究[J]. 现代图书情报技术, 2015, 31(6): 78-84.
[12] 何建民, 王哲. 社交网络话题信息传播影响簇发现谱系挖掘方法[J]. 现代图书情报技术, 2015, 31(5): 65-72.
[13] 黄文彬, 徐山川, 马龙, 王军. 利用通信数据的移动用户行为分析[J]. 现代图书情报技术, 2015, 31(5): 80-87.
[14] 郝玫, 王道平. 面向供应链的产品评论中客户关注特征挖掘方法研究[J]. 现代图书情报技术, 2014, 30(4): 65-70.
[15] 孙鸿飞, 侯伟. 改进TFIDF算法在潜在合作关系挖掘中的应用研究[J]. 现代图书情报技术, 2014, 30(10): 84-92.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn