Advanced Search
  首页 > 行业动态
Windows Azure助力“大数据”分析

Windows Azure助力“大数据”分析

    Windows Azure是微软基于云计算的操作系统,Windows Azure的主要目标是为开发者提供一个平台,帮助开发可运行在云服务器、数据中心、Web和PC上的应用程序。云计算的开发者能使用微软全球数据中心的储存、计算能力和网络基础服务。Azure服务平台包括以下主要组件:Windows Azure;Microsoft SQL数据库服务,Microsoft.Net服务;用于分享、储存和同步文件的Live服务;针对商业的Microsoft SharePoint和Microsoft Dynamics CRM服务。
    Windows Azure可以帮助用户确保所租用的超级计算时间不会超出支付能力,而且能够以很简单的方式来执行大规模计算的整体管理。与其他云服务提供商不同的是,Windows Azure上并没有需要用户管理或存储在个人账户所需要的虚拟内存(VM)图像,考虑到数以十万计的实例,无论是从管理或成本的角度上看,这都是一种优势。Windows Azure为用户提供操作系统(并且通过补丁程序,使它保持最新状态),用户只要将应用程序复制到Windows Azure上,然后在云中运行即可。
    正如Windows Azure产品管理总经理Bill Hilf所指出的那样,用户可以很容易地在Windows Azure上管理大小和类型不一的工作负载。如此庞大的计算能力对于“大数据”研究是至关重要的——它增进了我们对于复杂系统的理解。
    全基因组关联分析(The Genome-Wide Association Study, GWAS)就是一个很好的例子。微软研究院在Windows Azure上进行了一次27 000核的运行实验,对这项研究所涉及的数据进行处理。节点忙碌了72小时,耗用任务100万条,相当于大约190万个计算小时。如果我们在一个8核系统上运行相同的计算,需要25年才能完成!GWAS提供了一种强大的方法,可用于识别与人类疾病相关的遗传标记。它使用的数据是由威康信托基金(Wellcome Trust)提供的一次英国人口研究,有大约2 000个研究对象,此外还为7大疾病中的每一种提供了共计13 000人的共享对照组。为了进行高效的计算,微软研究院开发了Factored Spectrally Transformed Linear Mixed Model(FaST-LMM),这种算法能够使用比先前大几个数量级的数据,增强发现新生物关系的能力。它允许处理更大的数据集,因而可以检测到数据中更加微妙的信号。借助Windows Azure,微软研究院对威康信托基金的数据运行FaST-LMM,分析了63 524 915 020对遗传标记,并在这些双极性疾病、冠状动脉疾病、高血压、炎症性肠道疾病(Crohn氏病)、类风湿关节炎和I型及II型糖尿病的标记之间寻找相互关联。结果,发现了基因组与这些疾病之间的新关联,而这些发现可能预示着上述疾病在预防和治疗上的潜在突破。
    (编译自:http://blog.sina.com.cn/s/blog_4caedc7a0102el3i.html)

发布时间: 2013-01-25   浏览: 616
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn