Please wait a minute...
Advanced Search
现代图书情报技术  2011, Vol. 27 Issue (4): 17-23     https://doi.org/10.11925/infotech.1003-3513.2011.04.03
  数字图书馆 本期目录 | 过刊浏览 | 高级检索 |
云计算环境下大规模数据处理的研究与初步实现
张兴旺1, 李晨晖2, 秦晓珠1
1. 桂林理工大学图书馆 桂林 541004;
2. 桂林理工大学现代教育技术中心 桂林 541004
Research and Initial Implementation of Large-scale Data Processing Based on Cloud Computing
Zhang Xingwang1, Li Chenhui2, Qin Xiaozhu1
1. Guilin University of Technology Library, Guilin 541004, China;
2. Modern Education Technology Center, Guilin University of Technology, Guilin 541004, China
全文: PDF (822 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 将云计算技术引入到大规模数据处理过程中,提出在集中或分布管理的大量廉价计算机集群上构建动态的、可扩展的、高性价比的、易使用的高性能计算平台,创建一种基于云计算的大规模数据处理的框架模型。论述在这一环境下的大规模数据处理的方法和应用,通过搭建相应的计算平台,验证计算机集群及框架模型的可行性。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
张兴旺
李晨晖
秦晓珠
关键词 云计算大规模数据廉价计算平台HadoopMapReduce    
Abstract:This paper introduces a large-scale data processing method based on cloud computing, builds a dynamic, scalable, cost-effective, easy to use and high-performance computing platform on a large of centralized or distributed inexpensive computer cluster, and creates a cloud computing-based framework for large-scale data processing model. It also discusses the methods and applications in this large-scale data processing environment. The computing platform is set up to verify the computing cluster and the feasibility of this model.
Key wordsCloud computing    Large-scale data    Low-cost computing platform    Hadoop    MapReduce
收稿日期: 2011-01-17      出版日期: 2011-06-11
: 

TP393

 
基金资助:

本文系2010年度广西教育厅科研项目“基于云计算的数字化信息资源建设模型及服务体系的研究”(项目编号: 201010LX180)的研究成果之一。

引用本文:   
张兴旺, 李晨晖, 秦晓珠. 云计算环境下大规模数据处理的研究与初步实现[J]. 现代图书情报技术, 2011, 27(4): 17-23.
Zhang Xingwang, Li Chenhui, Qin Xiaozhu. Research and Initial Implementation of Large-scale Data Processing Based on Cloud Computing. New Technology of Library and Information Service, 2011, 27(4): 17-23.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2011.04.03      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2011/V27/I4/17
[1] 陈全,邓倩妮.云计算及其关键技术[J].计算机应用,2009,29(9):2562-2567.

[2] 孙兆玉,袁志平,黄宇光.面向数据密集型计算Hadoop及其应用初探[C].见: 2008年全国高性能计算学术年会.2008:441-443.

[3] Armbrust M,Fox A, Griffith R, et al. Above the Clouds: A Berkeley View of Cloud Computing[EB/OL].[2011-01-10]. http://www.EECS.berkeley.edu/Pubs/TechRpts/2009/EECS-2009-28.pdf.

[4] 刘真,刘峰,张宝鹏,等. 云计算模型在铁路大规模数据处理中的应用[J]. 北京交通大学学报,2010,34(5):14-19.

[5] Davis D. Server Virtualization, Network Virtualization & Storage Virtualization Explained[EB/OL].[2011-01-10]. http://www.petri.co.il/server-virtualization-network-stroage-virtualization.html.

[6] 虚拟化与云计算小组.虚拟化与云计算[M].北京:电子工业出版社,2009:56-81.

[7] Menken I, Blokdijk G. Cloud Computing Virtualization Specialist Complete Certification Kit[M].2009: 26-166.

[8] Pavlo A, Paulson E, Rasin A, et al. A Comparison of Approaches to Large Scale Data Analysis[C].In: Proceedings of the ACM SIGMOD International Conference. New York: ACM Press, 2009: 165-178.

[9] Kozuch M A, Ryan M P, Gass R, et al. Tashi: Location Aware Cluster Management [C].In:Proceedings of the ACM. Barcelona: ACDC,2009: 43-48.

[10] White T. Hadoop: The Definitive Guide[M]. 2nd Edition. O’Reilly Publications,2010:167-188.
[1] 杨恒,王思丽,祝忠明,刘巍,王楠. 基于并行协同过滤算法的领域知识推荐模型研究*[J]. 数据分析与知识发现, 2020, 4(6): 15-21.
[2] 高长元, 于建萍, 何晓燕. 基于改进粒子群算法的云计算产业联盟知识搜索算法研究*[J]. 数据分析与知识发现, 2017, 1(3): 81-89.
[3] 杨爱东,刘东苏. 基于Hadoop的微博舆情监控系统模型研究[J]. 现代图书情报技术, 2016, 32(5): 56-63.
[4] 范云满, 洪娜, 钱庆, 方安. 利用Hadoop/HBase的药物基因组数据云存储实践研究[J]. 现代图书情报技术, 2015, 31(5): 73-79.
[5] 卓可秋, 虞为, 苏新宁. 突发事件检测的MapReduce并行化实现[J]. 现代图书情报技术, 2015, 31(2): 46-54.
[6] 马宾, 殷立峰. 一种基于Hadoop平台的并行朴素贝叶斯网络舆情快速分类算法[J]. 现代图书情报技术, 2015, 31(2): 78-84.
[7] 赵华茗. 分布式环境下的文本聚类研究与实现[J]. 现代图书情报技术, 2015, 31(1): 82-88.
[8] 颜时彦, 王胜清, 罗云川, 黄浩军. 云环境下基于FCA的领域本体协作构建模式初探[J]. 现代图书情报技术, 2014, 30(3): 49-56.
[9] 虞为, 陈俊鹏. 基于MapReduce的书目数据关联匹配研究[J]. 现代图书情报技术, 2013, 29(9): 15-22.
[10] 肖强, 朱庆华, 郑华, 吴克文. Hadoop环境下的分布式协同过滤算法设计与实现[J]. 现代图书情报技术, 2013, 29(1): 83-89.
[11] 亢丽芸, 王效岳, 白如江. MapReduce原理及其主要实现平台分析[J]. 现代图书情报技术, 2012, 28(2): 60-67.
[12] 王伟军, 姜毅, 刘蕤, Kari Smolander. 云计算环境下软件测试研究进展[J]. 现代图书情报技术, 2012, (11): 3-9.
[13] 姜毅, 曹丽, 王伟军, Ossi Taipale. “测试即服务”概念模型研究[J]. 现代图书情报技术, 2012, (11): 10-15.
[14] 张一弛, 熊湘文, 黄雅文, 王世雄. 云计算环境下测试数据的界定与管理[J]. 现代图书情报技术, 2012, (11): 16-21.
[15] Udhyan Timilsina, Leah Riungu-Kalliosaari, Ossi Taipale, Kari Smolander, 王伟军. 公有云应用中测试的安全问题[J]. 现代图书情报技术, 2012, (11): 22-33.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn