李英文 DELL存储顾问
尊敬的各位领导,嘉宾和朋友们,大家下午好!我这边的话题主要是在工业4.0下面DELL的流动数据架构,前面说到工业4.0中对供应链的管理,还有我们各位嘉宾提出的关于工业4.0,甚至是工业的3.X的各个理念,里面所包含的最主要的内容,我们可以看到是围绕数据如何流动的问题,数据怎么样在供应链里面,怎么在工业的4.0里面进行更高效地流动?所以说我们DELL这次从数据这个工业4.0中最主要的原材料说起。今天的议题主要分成三个部分,首先,跟大家汇报一下存储的近况;其次是工业4.0会给IT的建设带来一个怎么样的压力或者是有什么影响;***就是DELL的流动数据架构如何帮助到各位来解决工业4.0下大数据对IT带来的压力。
首先跟大家汇报一下DELL中国的近况,DELL在中国经过了4.0的阶段,有1.0的直销模式,2.0的高效供应链的管理,3.0是从直销变成多元化的方式,将渠道管理和直销管理进一步融合。4.0就是目前的阶段,就是我们的口号叫在中国为中国,这就是DELL中国的4.0。
我们看一下IT业界最近的一个变化,作为IT圈子里的各位专家,大家都知道的IT业界迄今为止***的一个并购案,DELL用了670亿美元收购EMC,大家都会问对现在的DELL、EMC甚至VMware有什么影响呢?我们的CEO Michael先生非常肯定地告诉IT业界:DELL承诺我们给到的用户的所有的产品以及所有产品解决方案都会按照原来的策略继续下去,我们一定是以客户为中心的这样的理念的提供一个更完整解决方案的供应商,所有原来的产品线都会保留。
我们回到今天的主题,前面的各位专家和工业3.X甚至是4.0做了相当成熟的一些阐述在原来的传统工业化中,石油是最重要的材料,发展到现在我们说工业4.0的阶段,数据成为一个最关键的材料了。那么我们围绕数据的角度来看,工业4.0我们的IT基础架构建设应该做的一些变化,如何帮助把数据变成信息?而***变成知识给到我们的工业4.0以辅助我们的工业4.0蓬勃的发展。
我们说工业4.0或者是智慧工厂智能制造,一定会对我们的传统的IT架构带来一些挑战和影响,***个挑战就是成本,我们想用更少的成本做更多的事情,第二个当你的数据量的剧急增长,传统IT的数据是原来的ERP、PDM、MES、PLM等传统的系统里面出来的,现在从你的RFID,甚至是所有的机器都会产生大量的数据,会使得整个数据量变的非常非常大,这样的话就对于我们的数据量的剧急增长,IT的基础架构如何应变?
***一个就是当我们有了大量的数据,如何把数据变成知识?这一定得要有快速的数据分析工具帮助你,因为过时的知识对当前的业务是没有帮助的,就像股票那样,知道过去的波动是远远不够的,若能明析未来的走向才是最重要的。通过知识分析洞察未来才是王道。
回到工业4.0来看,就会发现它对传统IT的基础架构带来了非常大的影响。比如说业务流程,因为你要做柔性的制造,毕竟你面对市场的快速变化,制造流程的变化得非常的快速才能满足个性产品的需求,但你的IT的创新能不能满足它呢?我们这里将工业4.0对传统的IT影响归纳成为三个方面的挑战:***个挑战安全,数据是我们***工业4.0的血液。数据的安全性摆到了***位,工业4.0下数据的安全是如何保证的?第二个挑战是性能,当数据存储到后台,如何快速把数据变成知识给到前端的用户和应用这样就需要有一个很快速的性能;第三个就是成本,我们希望构建一个IT这样的基础架构去支撑这个工业4.0成本是不是可控的?
在我们进一步阐述DELL流动数据架构如何解决这三方面问题之前,先了解DELL存储流动数据架构的理念是怎么样的?
DELL存储流动数据架构是从数据的角度来解构的,因为所有的数据不可能是等同的,数据有不同的价值,举例说应用数据刚刚进来的时候可能会大量的读写,过了一段时间会变成冷数据甚至是冰数据,DELL存储流动数据架构首先可以在同一个存储里面可以对数据进行自动的分层,数据可以在存储里面进行流动,其次,数据还可以流动在多套存储之间进行流动,第三个流动就说我的应用的计算都在服务器上面,那如何把存储上面的数据跟我的服务器进行打通变成一个统一体?在DELL存储流动数据架构中服务器和存储之间通过闪存的方式打通变成一个完整的流动数据架构。DELL存储流动数据架构由以下三个阶段:服务器存储内部的流动,存储之间的流动,存储跟服务器之间的流动。
这个是我们对流动数据的定义,我们通过这样的动画可以更加地快速了解一下,首先我们可以看一下存储内部的自动流动,我们说数据可以在高速层中速层低速层,业务的不同要求数据会在存储之间存储内部做流动,因为在存储内部的高速中速低速之间把最重要的数据放在最上面,把冷数据放在最下面,从而降低整体存储的成本。其次就是说在存储之间的流动,我们说当我有多套存储的时候,数据可以根据整个存储变成存储池,比如说在三套存储之间根据业务的需求动态的调整性能和容量。***,就是然后到达后端的存储和前端的应用服务器联动实现冷热数据流动。这也是一个端到端的整体虚拟化池化的调动方式。
回到前面提出的三个问题,***个是安全性,大家都对安全来说都是不陌生的,在这个安全性里面,是不是大家都有这样的一个体会?比如说我们是不是把安全大部分放在物理的问题上面,比如说机房出现任何的问题时候,我的数据应用是不是能够实现业务连续性,但我们通过IDC的报告可以看出就硬件故障和逻辑故障而言,后者占的比重更大些,也就是意味着在日常的运维过程当中逻辑故障的概率更大。我们在考虑这个问题时,传统的做法也有很多,比如说要考虑硬件故障,一般就做一个容灾,逻辑故障就做个磁带或磁盘备份,但这样是不是就可以满足工业4.0对数据安全的要求呢?这个肯定不够的,我们可以看DELL在物理保护这一块用到的就是更先进的做法,存储内嵌的双核机制,就是利用到了我们数据在两套存储之间可以自动流动的概念,如果出现左边的存储宕机的话可以用右边的存储进行自动接管。这时候其上的虚机也可以自动无缝切换到另一个主机上面来,从而实现数据的双活以及应用的双活。而对于逻辑保护这一块我们也提出更高级的做法,传统的做法包括备份到CDP的概念,但是这样的架构比较复杂,而且可控性比较不强,为了满足工业4.0对数据安全的要求,我们可以看到这个时候逻辑保护又回到了存储本身,也就是说当我的这个数据出现在任何时间点有问题,并且同时出现物理故障的时候,右边的存储可以拉到上一分钟的数据一致性的保护点,保证逻辑故障可以恢复,这个就是我们DELL对安全方面的考虑。另外,除了存储的数据安全之外,肯定是需要对业务应用结合,DELL的存储除了前面的数据保护还有应用的保护包括对微软,VMware,Oracle业务应用结合的很紧密,这样当应用出现问题的时候,业务应用同样得以保护这样的方式。
关于工业4.0对数据性能要求的问题,大家都知道现在SSD对存储,服务器来说都是一个非常流行的趋势,讲到性能一定提到SSD,但是不是所有的SSD都是一样的,如何把这个SSD充分发挥好?提到 SLC它的性能好寿命长但是价格昂贵,可以说有优点有缺点,我们还知道有MLC,这个写寿命短但是读性能好且容量大价格便宜,所以这样情况下,DELL提出了一个非常创新的做法,通过SSD的分层实现读写分离,把写数据放到SLC上面,提高写性能,把读数据放在MLC上面,充分利用MLC的读性能,同时MLC磨损的寿命得以控制,通过这种方式实现读写的分离,未来的扩展变的非常轻松,所以按照不同的方式进行扩展我们的存储,比如,可以从***个阶段,全部用MLC以读为主,也可以直接跳到第二个阶段有读有写把应用分布在不同的SLC、MLC上,还可以按照后续的业务发展来增加不同层的应用。如果说读的数据比较多,只要加读的那一层的 MLC就可以了。从而实现非常灵活的架构,在这样的一个性能跟容量以及对安全的要求下面,通过这种智能的数据流动还可以在存储之间,存储和服务器之间进行流动这样的架构 。
***一个是关于成本的问题,DELL的流动数据通过存储系统智能地定位到哪些是热数据哪些是冷数据,从而实现把热数据放在SSD上面,所以这个时候冷数据可以放在大容量的机械盘上面,这个时候可以看到整个的成本就变得非常好控制了,因为我们知道在数据管理层面也是有一个二八原理,也就是20%是热数据,80%是冷数据。这样,在应对未来业务的发展的时候,成本就可以很好地得到降低。
所以回到工业4.0对IT的新要求来看,进一步说,工业4.0下对数据的管理角度来讲,新的IT架构需要有安全、性能、成本的统一考量,我们通过DELL存储流动数据管理这样的一个架构理念和方式,可以达到工业4.0对IT的需求。
***,DELL是一个提供了端到端存储整体解决方案供应商,所有的方案都离不开服务, DELL提供了一个专业的全面的支持服务,实现贴心的管家级无忧的服务支持。谢谢大家!
对话环节
对话嘉宾:通用电气IT经理 蔡建玺
蔡建玺:感谢大家,大家下午好,感谢各位领导还有各位同仁,我来自通用电气,因为可能大家在15年听说过,通用电气在历史上做了***的并购,阿尔斯通的发电,水利,电网集团并购过去了。目前负责通用电气电网的IT运营,同时负责阿尔斯通交通集团的IT服务。
李英文:我们刚才介绍了工业4.0下对IT对数据管理提出了更高的要求,也想借这个机会也跟我们GE的蔡经理探讨一下,我们在这里想探讨几个问题,***个问题是我想问一下对于GE来说,因为数据在工业4.0来说是一个非常关键管理对象,只有用的好才能促进工业4.0,才能更好地被这个企业利用,我想问的***个问题就是在我们的企业日常的运维当中,如何去看待数据?
蔡建玺:这个问题其实挺难回答的,因为不同的企业有不同的特点,数据种类也很多,有一些数据是非常普通的,包括整个供应链相关的数据,有一些又比较特殊的,比如说知识产权研发的,还有一些数据更加特殊,比如说人的信息,在有一些企业里面会把这个作为非常重要的数据,包括一些设计企业,纯生物的科技类的企业,这些对数据的定义也不一样。在我们的制造业里面,我们是这样看这个问题的。通常意义上可能我相信在座的很多企业都会涉及到文件型的数据,包括我们日常的邮件、办公、上级领导的一些文件,一些办公的交互的属于日常的文件,从企业生产的角度来看还有一些是整个生产中间发生的,存储的,或者是交易型的一些数据,***一块是在这些基础之上特别是财务部门或者是市场部门用来进行分析的一些数据,大概是这么理解的。
李英文:也就是说从数据的角度不是所有的数据在企业里面都是等同的,不同的数据有不同的角色,数据的价值也是不一样,DELL流动数据的架构就比较容易契合这一块的使用场景,通过重要的数据放在一个高性能的介质上去,而把一些冷数据,个人文件数据不用占用这么高性能的介质,放在大容量的4TB,6TB甚至8TB的硬盘上面,这样整个存储变的有目标有定位,高性能放重要的数据,大容量低价格存储的空间放一个价值比较低的数据,这样的话整个存放数据的存储整体成本就可控了。
蔡建玺:这个没有错,我们是跨国企业,像生产型的ERP数据这个是有明确的数据中心,这样的数据中心一般不会放国内,特别是集中式统一管理的,一定是像刚刚DELL的同事还有其他的友商介绍的做成两地三中心的架构,所有的数据传输是一套,通过企业的内部专线传输的,这个情况;还有一部分的数据是中国化的数据,这个是地方性的或者是工厂性的,这些数据也会在当地的数据中心存在,或者是称之为机房,这样的数据也很重要,但是对于整个集团来说和对整个公司来说损坏或者是中断发生灾难是在一定意义上可以接受,因为没有影响整个集团的运营。再往后看,还有一部分数据是重要性相当低的,比如说某一些日常经常处理的一些数据,甚至我们已经有备份的数据真的发生问题的时候,不重要的一些东西,是可以在企业的安全级别上面或者是等级上面会忽略的。再***就是个人数据,如果个人数据存在个人电脑上面的话这个损失对于集团几乎是微乎其微了,对于工厂或者是中国区来说对于老板来说只是一个个人的损失,再次,还有恢复技术手段可以恢复出来,我们是这么看数据登记的。
李英文:我问的第二个问题我们怎么对数据的保护,现在业界大家提出的双活,怎么理解,怎么跟数据的价值不同能够相挂钩?
蔡建玺:首先把数据做分级,重要的数据肯定用重要的方法对待,次要的数据用相对次要的方法对待,具体我们苏州有工厂,苏州工厂是这样做的,我们本地也有ERP,ERP的数据毫无疑问是非常非常重要的,对于工厂的运营来说,因为刚刚前面讲过整个集团来说工厂运营挂了就挂了,并不影响集团的运营,但是对存储也好,虚机也好主机也好一定要有冗余的,这个基础上,我们称之为供电设施,这个电力保证非常重要。去年淘宝挖断光纤,不保证挖断电缆会带来停电,这个对工厂的运营是非常致命的,这个情况下我们要保证基础运营,供电是一个很重要的条件,其次就是存储的本身一个HA也好,双活也好也需要有保证;还有一点跟大家跟不同企业的数据的要求不一样,正如刚刚介绍得那样,有用到固态硬盘,有更快速的硬盘,1万5千转的,还有7200转的,什么样的系统应该放在更快的硬盘上面?哪些系统放在更慢的硬盘上面?显然对销售型的公司CRM,还有一些有要求的放在高速的硬盘上面,对性能要求不高只是文件读取的,包括特殊的行业,我们不是那么重要或者是紧急的话,放在相对低速的磁盘上面形成方案。还有一种最慢的情况,就是发生磁带上面,数据需要读的时候才读取,还有光盘塔这样的读数据的情况。
李英文:在GE这边对数据做了分类并做了分层管理,同时对数据中心保护也同样按分级做相应的机制,就像UPS物理基础架构这样的安全。在日常的运维当中还考虑到逻辑安全,逻辑的保护也是整个IT基础架构支撑最重要的环节,不光是物理的保护还有逻辑的保护,在整个IT架构里面设计的时候统一考虑进去,把SSD的性能层和大容量的数据分层统一归纳进来,从而达到又有性能又有安全这样的一个方式整合。这样就可以轻松面对工业4.0下大数据情形之下对于IT新形式的要求。再次谢谢蔡经理的心得分享。