隐形基础设施是数据中心的下一次进化——黄莺

  • 2015-08-21 18:46:37
  • DAMS原创

黄莺 | Nutanix中国区总经理


大数据最关键的一点就是要运行在一个核心的基础架构上,那在数据量不断增加的情况下我们的基础架构又是如何去支撑这样的业务量呢?我今天要讲的主题就是隐形数据中心。

作为IT人员,大家都很熟悉数据中心,里面有服务器、网络及存储。这样的架构,我们每10年就能感觉到一个技术上的进步。稍微有点年龄的人都知道大概在2000年左右,交换机、以太网刚出现,那个时候的技术是怎么样的。而最近的10年里,虚拟化已经席卷了整个IT界。基本上每个人多多少少都听过虚拟化,进行过虚拟化,也接触过虚拟化的一些厂商。虚拟化的发展都是在server(服务器)这一端,而我们底层的数据中心还运行在网络SAN这样的存储架构之下。当然也有很多公司都在求变,例如Sun公司,就是一个没有适应变化而消失的公司。


这里还有一张图,就是之前纽交所有4个小时的交易系统没有办法运行的事件。

这个事件的发生是由于他们有一个configuration issue使得业务停顿了4个多小时。造成这个情况的主要原因还是他们数据中心的架构有点古老了,没有适应到一个新的架构之下,最终使得他们产生了一个由于系统原因造成的业务运行的停顿。那如果他能及早的适应这个变化,能应用我们今天要说的永远不停机的数据中心的话,那就不会发生这样的情况。这里我主要就是想说明要适应新的变化才不会让我们的业务中断。

图一

图二

图三

图四

图五


这是一系列非常漂亮的图,展示了人类从缓慢而安全的马车进化到快速而危险的空中交通。图二是三十年代德国奥登堡发明的一个飞艇,很不幸的是最后飞艇也爆炸了。如今交通工具已经发展到大家都很熟悉的使用引擎系统,而引擎是由很多parts组成,里面还用着汽油和高压活塞,我们每天都在开,实际上是很不安全的。汽车行业也在变,希望变得简单,安全。例如图四的特斯拉。实际上特斯拉是一个构造非常简单的汽车,也非常安全,不再有燃烧的事情发生,因为他是用电,里面的构造就是电动马达加电池。这组图片说明了我们的时代在时刻的变化,我们的汽车也由复杂化进入简单化。


还有一个案例就是讲到我们叫车的办法。

过去我们想坐出租车都是要站在路边去拦,但Uber和滴滴的出现改变了这个生态圈。我们现在还站着去叫车的话就过时了,而且如果我们没有Uber或滴滴出门会变得极其不便,出租司机不加入到这种联盟来的话也是基本上接不到活。如此继续发展下去,像特斯拉和Google还在发明自动驾驶的汽车,可能将来我们都不太需要用人去驾驶汽车了。这就是一个技术的进步。

以上这张图讲到的是电池。手机原来还处在用电池或者是给电池充电这样一个各种品牌泛滥的电池时代,如今我们完全不用知道手机电池里面装的是什么东西,而只需要知道它还剩多少的电,然后插上充电就好了。这些都在说明我们基础架构的东西都变得隐形化了。对客户或者每一个个体人来说,体验是关键,如何用的更方便、更简单,这是一个核心的寓意。


下面我们回归到主题,来说一下数据中心的软件定义(software define)。

我们IT的架构处在一个深刻的变革中,基础架构也变得隐形,IT的人不再需要花很多时间去弄线、硬件这些配置,而是整体提升到一个业务的层面。数据中心的软件定义实际上就是说:这个基础架构是来自于谷歌、facebook这样的企业,他们在尝试了传统的IT架构之后发现没办法满足快速的软件开发这个要求,所以他们开发了自己的一个文件系统。这个文件系统的寓意其实就是web scale,即网络规模的数据中心,也就隐含着隐形数据中心的概念。他们的数据其实已经运行在标准的X86的硬件上面,一键智能,可以由软件来实现所有的功能。例如iPhone的出现,它有个深刻的变革就是改变了手机、照相机、还有音乐这样的行业,现在我们拿一个智能手机已经可以把所有的功能都包括在内。


软件定义的数据中心其实也是在做同一件事情,一个数据中心的革命,把各种各样的IT相关的业务例如数据保护、服务、计算、存储的功能全部集中在一个软件系统之上,然后它运行在一个标准的X86的服务器上面,它的一切智能和服务都由软件来实现,它的文件系统都是由分布式的文件系统来管理。这样做的好处一方面是带来一个完全线性的增长,你可以从一个节点开始无限的横向扩展,然后它的系统由于冗余的架构使得不会宕机,另外一方面就是软件更新相当快,技术核心都在软件方面,运行方便,成本非常的低。

如上图所示,我们的大脑左边是管智能、智力。做IT的都知道数据中心常用的Zoning、Masking、Luns等每天都在干的这些活。它能满足业务的需求,但是超级复杂,这就跟我们的汽车从复杂的结构走向特斯拉类型,不是说他不行而是他的复杂性造成高成本,改变起来非常困难。


右边是我们现在这个大脑的发展。在新的软件定义存储下面的数据中心,我们不再需要SAN和SQL,而用软件管理就使得我们右边的图变得非常的简单,不需要我们去懂得各种各样技术的细节,只需要管理软件,操作使用都很简单。

以上这张图说的是我们很熟悉的传统数据中心。这里有计算服务器,通过SAN对我们底下的数据进行一个存储,进行分享。但是它有一个问题就是一旦发生了一个业务,一定要去预测一年或者三年你需要多少的数据量,预测之后再去进行采购业务,然后当你的业务发展到一定的层面不够用了的时候,你可能还需要在旁边重新建一个,不过由于SAN服务器的Controller的扩展是有限的,所以业务到一定层面也会扩不上去。管理时,如果系统出现了问题像刚才说到的纽交所一样,那么你可能就需要去找服务器厂商、网络厂商、存储厂商。但其实你让他们去找到一个问题是相当复杂的,所以今天我们要来解决这个问题:

以上这张图说的是我们很熟悉的传统数据中心。这里有计算服务器,通过SAN对我们底下的数据进行一个存储,进行分享。但是它有一个问题就是一旦发生了一个业务,一定要去预测一年或者三年你需要多少的数据量,预测之后再去进行采购业务,然后当你的业务发展到一定的层面不够用了的时候,你可能还需要在旁边重新建一个,不过由于SAN服务器的Controller的扩展是有限的,所以业务到一定层面也会扩不上去。管理时,如果系统出现了问题像刚才说到的纽交所一样,那么你可能就需要去找服务器厂商、网络厂商、存储厂商。但其实你让他们去找到一个问题是相当复杂的,所以今天我们要来解决这个问题:

打开两优的这个设备,可以更直观的看到里面由四个服务器组成,X86,双CPU……所有这些东西都是大家非常熟悉的,因为它的软硬件都是大家平常可以接触到的。


下面来看下超融合架构的技术实现。

这是NUTANIX的超融合架构,它是一个分布式的文件系统,里面每一个绿色的CVM都停留在每个box上面,数据在本地,性能非常好。同时如果其中一个CVM出于某种原因宕掉以后,另外一个机器上的CVM会起来承接前面failed的CVM,使得它的应用不会宕机。所有的数据都到了本地,不需要通过SAN来共享。对于技术人员来说如果想知道我们的文件系统是基于什么来开发的,下面就是比较技术的东西。NUTANIX的分布式文件系统就是基于Cassandra——开源分布式NoSQL数据库系统来开发的,也用到了Zookeeper 和 Stargate等开源技术,实现了企业级的数据中心所要的计算存储和数据保护的一系列功能。

上图是超融合架构带来的好处:具有企业级存储所要的数据保护、冗余和安全,能支持现有所有虚拟化的Hypervisors软件,包括VMware、Microsoft以及开源的KVM,如果一个企业比较省钱的话,免费使用的KVM的Hypervisors也是足够得到了。数据本地化,数据的Balanceing、Caching、Tlering都在本地能够做到。每个盒子都会有SSD、HDD等存储,还有计算全部都再这样的盒子里面。


接下来讲一下隐形数据中心的三个层面:1.超融合的设备让存储隐形。存储进入到了每个盒子里面去,等你的应用需要的时候你只需要通过界面就可以分配资源给某个应用,这样你的存储就变隐形了。2.虚拟化隐形。可以运行到不同的虚拟软件上面,只要一键式就可以做得到。3.云隐形。这指的是企业有内部私有云,外部公有云,而应用从私有云和公有云之间的转换是一件非常容易的事情,只需要关注你的应用即可。

存储隐形通过NUTENIX的操作系统就能够做得到因为存储直接接入到了每个超融合设备里面。然后我们的XTM Computing Platform也使得我们的虚拟化也隐形,我们的应用在不同的Hypervisors上都可以进行移植,而已非常容易。Prism跟Acropolis都是我们的两个软件,通过这两个软件可以使得虚拟化提高到云的层面,让你非常自如的在应用层面进行切换。当中Prism就是一键式管理。

以上是一张比较直观的图,我们的计算平台由Prism和Acropolis两部分组成,底层就是分布式的存储,然后ESXI、Hyper-v都是存储层面,存储界面是私有云,如果是企业内部一般是通过这种虚拟软件去建立私有云。在外部,如果有AWS、Azure这种公有云,那你的应用是可以移动的,可以很容易的在公、私两边进行切换。如果你的应用运行在企业内部,私有云可以拿来满足平时的要求,公有云则应付比如“双十一”这样的峰值业务,使得两边可以打通,进行切换。前面已经提到我们隐形数据中心管理非常容易,一键式就可以做规划、补给、修复、升级,这些就是通过Prism来做。

对于一般的数据中心,不同的软硬件可能都有自己的管理界面,使得管理员不停地切换来管理。实际上通过我们的技术只需对着一个界面就可以管理所有的应用,数据中心底下的所有东西都可以通过软件来管理。

以上是一键式对Hypervisors 应用层的改变。比如,所有的虚机上都是运行ESX的Hypervisor,有一天你发现太贵了,你需要运行在免费的KVM上面,你只需要research,就可以把第二排变到KVM上。比如你的应用在开发方面不需要太好的虚拟盘、虚拟软件,你可以放到KVM上。你还可以放到大数据的Containers上,最后还可以把一部分应用拓展到公有云上去,都是通过一键式就可以改变,都是通过隐形数据中心的方式来改变。

最后,这个两优的超融合架构可以运行的应用。基本上企业级的应用,VMware、KVM、大数据、微软、SAP、Oracle,都经过验证可以跑在这个超融合盒子上。


(“中国数据资产管理峰会/DAMS 组委会”整理成文,架构师联盟微信号:jiagoushi2015)