Please wait a minute...
Advanced Search
现代图书情报技术  2008, Vol. 24 Issue (8): 63-69     https://doi.org/10.11925/infotech.1003-3513.2008.08.11
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于事务标识列表的关联规则挖掘算法
王强1,2
1(中国科学院国家科学图书馆 北京 100190)
2(中国科学院研究生院 北京 100049)
Algorithm for Mining Association Rule Based on the Identifier Lists of Transactions
Wang Qiang1,2
1(National Science Library, Chinese Academy of Sciences, Beijing 100190, China)
2(Graduate University of the Chinese Academy of Sciences, Beijing 100049, China)
全文: PDF (852 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

设计并采用Java语言实现基于事务数据库标识列表的频繁项集的产生算法——TidlistApriori。通过与采用Hash-Tree的Apriori算法进行比较,表明TidlistApriori能够提高频繁项集的产生效率,可以成为主题关联挖掘的有效算法工具。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
王强
关键词 频繁项集关联规则挖掘数据挖掘主题关联    
Abstract

 This paper designs and implements an algorithm named TidlistApriori for mining association rule based on the identifier lists of transactions in database using Java.The results of experiment comparing TidlistApriori with Apriori based on Hash-Tree indicate that this algorithm can improve the efficiency of finding frequent item sets, and TidlistApriori can be used as efficient tool for mining topic association.

Key wordsFrequent item sets    Association rule mining    Data mining    Topic association
收稿日期: 2008-05-09      出版日期: 2008-08-25
: 

TP311 

 
  TP181

 
通讯作者: 王强     E-mail: wq971120@163.com
作者简介: 王强
引用本文:   
王强. 基于事务标识列表的关联规则挖掘算法[J]. 现代图书情报技术, 2008, 24(8): 63-69.
Wang Qiang. Algorithm for Mining Association Rule Based on the Identifier Lists of Transactions. New Technology of Library and Information Service, 2008, 24(8): 63-69.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2008.08.11      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2008/V24/I8/63

[1] 毕建欣, 张岐山.关联规则挖掘算法综述[J].中国工程科学,2005,7(4):88-93.
[2] Jiawei H, Micheline K.数据挖掘概念和技术[M].范明,孟小峰译.北京:机械工业出版社,2001.
[3] Agrawal R, Srikant R. Fast Algorithms for Mining Association Rules[C]. In:Proc of the 21th International Conference on Very Large Database. Chile,1994:487-499.
[4] Savasere A, Omiecinski E, Navathe S. An Efficient Algorithm for Mining Association Rules in Large Databases[C]. In:Proc of the 21th International Conference on Very Large Database. Switzerland, 1995:432-443.
[5] Park J S, Chen M S, Yu P S. An Effective Hash-based Algorithm for Mining Association Rules[C].In:Proceedings of the 1995 ACM SIGMOD International Conference on Management of data.ACM,1995:175-186.
[6] 李淑芝,郑剑. 一种基于Hash-tree的产生关联规则的方法[J]. 南昌大学学报:理科版),2004,28(2):197-204.
[7] Mannila H, Toivonen H, Verkamo A. Efficient Algorithm for Discovering Association Rules[C]. AAAIWorkshop on Knowledge Discovery in Databases.1994:181-192.
[8] Brin S, Motwani R, Ullman J D, Tsur S. Dynamic Itemset Counting and Implication Rules for Market Basket Analysis[J]. ACM SIGMOD Record, 1997,26(2):255-264.

[1] 谢旺, 王丽珍, 陈红梅, 曾兰清. 基于空间序偶模式挖掘污染源与癌症病例的关系 *[J]. 数据分析与知识发现, 2021, 5(2): 14-31.
[2] 张勇,李树青,程永上. 基于频次有效长度的加权关联规则挖掘算法研究 *[J]. 数据分析与知识发现, 2019, 3(7): 85-93.
[3] 陆泉,朱安琪,张霁月,陈静. 中文网络健康社区中的用户信息需求挖掘研究*——以求医网肿瘤板块数据为例[J]. 数据分析与知识发现, 2019, 3(4): 22-32.
[4] 牟冬梅,法慧,王萍,孙晶. 基于结构方程模型的疾病危险因素研究*[J]. 数据分析与知识发现, 2019, 3(4): 80-89.
[5] 张金柱,王玥,胡一鸣. 基于专利科学引文内容表示学习的科学技术主题关联分析研究 *[J]. 数据分析与知识发现, 2019, 3(12): 52-60.
[6] 刘俊婉,龙志昕,王菲菲. 基于LDA主题模型与链路预测的新兴主题关联机会发现研究*[J]. 数据分析与知识发现, 2019, 3(1): 104-117.
[7] 李勇男. 贝叶斯理论在反恐情报分类分析中的应用研究*[J]. 数据分析与知识发现, 2018, 2(10): 9-14.
[8] 牟冬梅, 王萍, 赵丹宁. 高维电子病历的数据降维策略与实证研究*[J]. 数据分析与知识发现, 2018, 2(1): 88-98.
[9] 胡忠义, 王超群, 吴江. 融合多源网络评估数据及URL特征的钓鱼网站识别技术研究*[J]. 数据分析与知识发现, 2017, 1(6): 47-55.
[10] 江思伟, 谢振平, 陈梅婕, 蔡明. 混合特征数据的自解释归约建模方法*[J]. 数据分析与知识发现, 2017, 1(12): 92-100.
[11] 牟冬梅,任珂. 三种数据挖掘算法在电子病历知识发现中的比较*[J]. 现代图书情报技术, 2016, 32(6): 102-109.
[12] 李峰,李书宁,于静. 面向院系的高校毕业生图书馆记忆系统[J]. 现代图书情报技术, 2016, 32(5): 99-103.
[13] 徐月梅,李杨,梁野,蔡连侨. 基于流形学习的新闻主题关系构建和演化研究*[J]. 现代图书情报技术, 2016, 32(10): 59-69.
[14] 赵静娴. 基于决策树的网络伪舆情识别研究[J]. 现代图书情报技术, 2015, 31(6): 78-84.
[15] 何建民, 王哲. 社交网络话题信息传播影响簇发现谱系挖掘方法[J]. 现代图书情报技术, 2015, 31(5): 65-72.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn