公共卫生英格兰为分析构建了Ceph和光泽云
公共卫生英格兰(PHE)在其IT战略的中心置于开源存储,私有云构建在Red Hat的Ceph对象存储分布和用于高性能计算(HPC)分析的DDN支持的光泽平行数据系统。
此举允许它避免供应商锁定,并在英格兰南部三个地点构建一个Petabyte级存储环境,以支持Phe的医疗保健分析。
PHE是在2013年创建的超过70家机构,为NHS和其他公共和私人组织提供科学支持,在公共卫生领域。
它雇用约5,500人和其活动的核心是三个关键领域的数据分析。
首先是生物信息学,其分析了对传染病监测的DNA,需要具有许多小型工作和许多CPU和磁盘输入/输出(I / O)的高吞吐量计算。
第二个是建模和经济学,运行实时模拟以预测预期的疾病动态。
第三是应急响应,运行多种模型,以预测传染病威胁所带来的风险。
后两者主要需要传统的HPC,但很多CPU和低于中等磁盘I / O.
当PHE形成时,需要为新创建的身体构建共享IT基础设施。
Francesco Giannoccaro(高性能计算和PHE的基础设施负责人)表示,Windows和VMware正在用于商业和常用工作负载,但必须根据文件系统环境所用的选择。
“[戴尔EMC] Isilon性能很高,但相当昂贵,而不是用于高速的并行I / O,更多的虚拟机。[IBM'S] GPFS与世界500强超级计算机用户的大约40%相同,但技能组织不一定在那里,“Giannoccaro说。
PHE与DDN SFA10K硬件上的Lustre文件系统进行了BioInformatics HPC集群。后来被要求在整个组织开始对HPC环境开始工作。
关键考虑因素是,三个主要的HPC集群不会在全额利用时运行24/7/365。出于这个原因,其中,本组织与KVM虚拟机管理程序和基于OpenStack的HPC云定居在红帽虚拟化环境中。此云架构允许每个HPC集群在需要时突发到其他处理容量。
在这个云环境中,PHE科学数据目录是使用IROD开发的开源技术,该开源技术有助于组织,目录,聚合和共享大集数据。
存储方面,生物信息学1,500核心光泽集群位于DDN ES7K硬件上,具有400TB的存储容量(加上500TB的档案)。
同时,紧急响应和统计和建模集群 - 拥有3,000个核心 - 在HPC云中的红帽Ceph在Lenovo刀片服务器上运行,拥有500TB存储和8PB的存档容量。
Flash用于Lustrata的元数据,而Ceph环境包括混合闪存的存储器。
“光泽是最广泛用于I / O型大量数据的技术,”Giannoccaro说。
他说,沿着开源路线走出的一些优势是它“减少供应商锁定,并以其他组织可以访问和分享信息的方式开放”
对于其云基础架构,Ceph是OpenStack环境背后的存储。
“这是对Openstack最广泛的扩散,”Giannoccaro说。“我们希望在合适的合作伙伴中找到合适的技术与某些人之间的适当平衡。”
Theph平均基于多个存储节点的软件产品和一种名为RadoS(可靠的自主分布式对象存储)的技术,该技术在多个集群中布置和管理数据。
红帽套餐和销售一款商业版的Ceph,销售的帽子帽子Cephaltage。
Ceph支持S3,SwiftAdd本机对象协议,以及提供文件和块存储产品。
Lustres是Anopen SourceParlyistRibuted File系统,为大型ScaleCluster计算而构建。光泽的开放式许可和高性能意味着它是常用的insupputerapplications。
Giannoccaro表示,Phe的下一个前接热门将使用红色帽子的OpenShift容器管理平台使用集装箱来使用并迅速将内容缩短到其网前端。