Please wait a minute...
Advanced Search
现代图书情报技术  2013, Vol. 29 Issue (1): 83-89     https://doi.org/10.11925/infotech.1003-3513.2013.01.13
  应用实践 本期目录 | 过刊浏览 | 高级检索 |
Hadoop环境下的分布式协同过滤算法设计与实现
肖强1, 朱庆华1, 郑华2, 吴克文1
1. 南京大学信息管理学院 南京 210093;
2. 南京大学工程管理学院 南京 210093
Design and Implementation of Distributed Collaborative Filtering Algorithm on Hadoop
Xiao Qiang1, Zhu Qinghua1, Zheng Hua2, Wu Kewen1
1. School of Information Management, Nanjing University, Nanjing 210093, China;
2. School of Engineering Management, Nanjing University, Nanjing 210093, China
全文: PDF (598 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 以开源项目Hadoop为实验平台,论证传统协同过滤算法无法适应云平台;从相似度和预测偏好两方面,借鉴共词分析法,将传统协同过滤算法改进为适应Hadoop平台的分布式协同过滤算法;实现顺序组合式MapReduce协同过滤任务,并做进一步实验分析。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
肖强
朱庆华
郑华
吴克文
关键词 Hadoop协同过滤大数据分布式云计算    
Abstract:Based on Hadoop, this paper demonstrates that traditional collaborative filtering algorithm cannot adjust to cloud computing platform, then improves traditional collaborative filtering algorithm to adapt to the Hadoop platform from similarity and prediction,and also achieves sequential modular MapReduce collaborative filtering computing tasks.
Key wordsHadoop    Collaborative filtering    Big data    Distributed    Cloud computing
收稿日期: 2012-12-27      出版日期: 2013-03-29
:  TP393  
基金资助:本文系国家社会科学基金项目“互联网用户群体协作行为模式的理论与应用研究”(项目编号:10ATQ004)的研究成果之一。
通讯作者: 肖强     E-mail: njhnxq@163.com
引用本文:   
肖强, 朱庆华, 郑华, 吴克文. Hadoop环境下的分布式协同过滤算法设计与实现[J]. 现代图书情报技术, 2013, 29(1): 83-89.
Xiao Qiang, Zhu Qinghua, Zheng Hua, Wu Kewen. Design and Implementation of Distributed Collaborative Filtering Algorithm on Hadoop. New Technology of Library and Information Service, 2013, 29(1): 83-89.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2013.01.13      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2013/V29/I1/83
[1] 李树青.个性化信息检索技术综述[J]. 情报理论与实践,2009,32(5):107-113.(Li Shuqin. Review of Personalized Information Retrieval Technology[J].Information Studies:Theory & Application, 2009,32(5):107-113.)
[2] Liu Z B,Qu W Y,Li H T,et al.A Hybrid Collaborative Filtering Recommendation Mechanism for P2P Networks[J].Future Generation Computer Systems,2010,26(8):1409-1417.
[3] Pan R, Scholz M. Mind the Gaps: Weighting the Unknown in Large-Scale One-Class Collaborative Filtering[C].In: Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Paris, France. New York: ACM, 2009:667-676.
[4] Pan R, Zhou Y H, Cao B, et al. One-Class Collaborative Filtering[C].In: Proceedings of the 8th IEEE International Conference on Data Mining, Pisa. Washington, DC, USA: IEEE Computer Society,2008:502-511.
[5] Salakhutdinov R, Mnih A. Probabilistic Matrix Factorization[C].In: Proceedings of the 25th International Conference on Machine Learning. New York: ACM,2008:880-887.
[6] 侯经川,方静怡.数据引证研究:进展与展望[J]. 中国图书馆学报, 2013,39(1):112-118.(Hou Jingchuan, Fang Jingyi. Review on Data Citation in the Context of Big Data[J].Journal of Library Science in China, 2013,39(1):112-118.)
[7] 韩翠峰.大数据带给图书馆的影响与挑战[J]. 图书与情报,2012(5):37-40.(Han Cuifeng. The Impact and Challenges of the Library Based on Big Data[J]. Library & Information, 2012(5):37-40.)
[8] Sarwar B, Karypis G, Konstan J,et al.Item-based Collaborative Filtering Recommendation Algorithms[C].In: Proceedings of the 10th International Conference on World Wide Web. New York, NY, USA: ACM,2001:285-295.
[9] Resnick P,Iacovou N,Suchak M et al.GroupLens:An Open Architecture for Collaborative Filtering of Netnews[C]. In:Proceedings of the 1994 ACM Conference on Computer Supported Cooperative Work. New York, NY, USA:ACM, 1994:175-186.
[10] Sarwar B,Karypis G,Konstan J,et al.Item-based Collaborative Filtering Recommendation Algorithms[C].In:Proceedings of the 10th International Conference on World Wide Web. New York, NY, USA:ACM,2001:285-295.
[11] White T. Hadoop: The Definitive Guide[M].The 3rd Edition. USA: O'Reilly Media, 2012.
[12] Dean J, Ghemawat S. MapReduce: Simplified Data Processing on Large Clusters[J].Communications of the ACM, 2008,51(1):107-113.
[13] Hadoop.HDFS Users Guide[EB/OL].[2012-12-02]. http://hadoop.apache.org/docs/stable/hdfs_user_guide.html.
[14] Bahga A, Madisetti V K.Analyzing Massive Machine Maintenance Data in a Computing Cloud[J].IEEE Transactions on Parallel and Distributed Systems,2012,23(10):1831-1843.
[15] 冯璐,冷伏海.共词分析方法理论进展[J]. 中国图书馆学报,2006,32(2):88-92.(Feng Lu, Leng Fuhai. Development of Theoretical Studies of Co-word Analysis[J].Journal of Library Science in China,2006,32(2):88-92.)
[16] Sarwar B, Karypis G, Konstan J,et al. Analysis of Recommendation Algorithms for E-commerce[C].In: Proceedings of the 2nd ACM Conference on Electronic Commerce. New York: ACM, 2000:158-167.
[1] 常志军,钱力,谢靖,吴振新,张鹄,于倩倩,王颖,王永吉. 基于分布式技术的科技文献大数据平台的建设研究*[J]. 数据分析与知识发现, 2021, 5(3): 69-77.
[2] 李振宇, 李树青. 嵌入隐式相似群的深度协同过滤算法*[J]. 数据分析与知识发现, 2021, 5(11): 124-134.
[3] 陈仕吉, 邱均平, 余波. 基于Overlay图谱的图情领域大数据主题分析*[J]. 数据分析与知识发现, 2021, 5(10): 51-59.
[4] 杨辰, 陈晓虹, 王楚涵, 刘婷婷. 基于用户细粒度属性偏好聚类的推荐策略*[J]. 数据分析与知识发现, 2021, 5(10): 94-102.
[5] 赵宇翔,练靖雯. 数字人文视域下文化遗产众包研究综述*[J]. 数据分析与知识发现, 2021, 5(1): 36-55.
[6] 王建冬,于施洋. 构建国家经济大脑的实践探索与初步设想 *[J]. 数据分析与知识发现, 2020, 4(7): 2-17.
[7] 邱尔丽,何鸿魏,易成岐,李慧颖. 基于字符级CNN技术的公共政策网民支持度研究 *[J]. 数据分析与知识发现, 2020, 4(7): 28-37.
[8] 杨恒,王思丽,祝忠明,刘巍,王楠. 基于并行协同过滤算法的领域知识推荐模型研究*[J]. 数据分析与知识发现, 2020, 4(6): 15-21.
[9] 苏庆,陈思兆,吴伟民,李小妹,黄佃宽. 基于学习情况协同过滤算法的个性化学习推荐模型研究*[J]. 数据分析与知识发现, 2020, 4(5): 105-117.
[10] 郑淞尹,谈国新,史中超. 基于分段用户群与时间上下文的旅游景点推荐模型研究*[J]. 数据分析与知识发现, 2020, 4(5): 92-104.
[11] 师洪波,郭红梅,岳婷,钱力,黄定余,常志军. 基于分布式大数据技术的科学计量模块化分析平台构建研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 231-238.
[12] 丁勇,陈夕,蒋翠清,王钊. 一种融合网络表示学习与XGBoost的评分预测模型*[J]. 数据分析与知识发现, 2020, 4(11): 52-62.
[13] 王建冬. 大数据在经济监测预测研究中的应用进展*[J]. 数据分析与知识发现, 2020, 4(1): 12-26.
[14] 焦富森,李树青. 基于物品质量和用户评分修正的协同过滤推荐算法 *[J]. 数据分析与知识发现, 2019, 3(8): 62-67.
[15] 李珊,姚叶慧,厉浩,刘洁,嘎玛白姆. 基于ISA联合聚类的组推荐算法研究 *[J]. 数据分析与知识发现, 2019, 3(8): 77-87.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn