截然相反的两个数字,将数据与这个时代之间的“割裂”体现得淋漓尽致。
第一个数字是数据在不断变大。根据IDC的预测,全球数据总量预计2020年将达到44个ZB,到2025年更将达到175ZB。而从企业的角度看,很多企业每年的数据增长量达到40%~60%,部分企业的数据量甚至呈指数式的增长。
而另一个数字则来自于麦肯锡的报告显示,目前大部分的企业对于自己所拥有数据的利用率还不足5%。
一面是不断膨胀和爆发的数据量,另一面则是低于5%,甚至还在变得更低的数据使用率。这似乎为企业的数字化转型蒙上了一层阴影。企业在新的数据时代,应该怎样面对数据价值与应用之间的鸿沟?
3月26日,浪潮面向云数智应用,推出新一代数据中心级高端存储平台和新一代数据中心级分布式存储平台,在新数据时代,也许我们可以从中找到确切的答案。
新数据时代催生新存储
其实在去年,浪潮就提出了新数据时代的理念。浪潮的观点认为,在新数据时代里,数据不再只是物理世界的“记录者”,而是成为了新的生产资料,并逐渐发展出价值闭环。
的确,随着云计算、大数据、AI、IoT、5G等新技术的快速发展,使得新应用层出不穷,会产生新的数据形态、新的部署环境、新的应用模式、新的价值需求,这已成为所有行业的普世需求,所以定义这个变化为“新数据时代”是非常合理的。
在我看来,新数据时代的主要驱动力是企业从过去的“业务驱动”转向“数据驱动”。所以,企业必须要关注到数据发生着什么变化。
一方面,是数据量在无限放大,如前文所述,到2025年的175ZB数据量从今天的眼光看是非常惊人的。另一方面则是,数据类型的多样化。比如诸如文本、图片、音频和视频等非结构化数据的大量衍生,推动分布式存储和对象存储的需求出现了爆发式增长。
而从存储的角度,未来几年的快速增长也是可以预期的。根据IDC发布的报告,2018年中国外部存储市场2018年整体出货量为15.2万台,同比增长15.0%。其中,浪潮存储的成绩尤为亮眼,在2018年出货量13880台,增速26.8%居中国第一。
不难发现,新数据时代既增加了数据处理的难度,也为存储行业提出了很多新的课题,与此同时,也让传统存储的生存空间不断被压缩,新数据时代,本质上就是属于新存储的时代。
如浪潮集团副总裁胡雷均所说,“我们处在一个不确定性的时代,唯一确定的就是不确定性。新数据时代各个行业用户提出了更多不确定的、场景化的需求,需要新的存储模式。”
新存储将遵循业务为导向
行业里一直有“存储危机论”的存在,这种观点认为,存储在大规模数据中心中的地位在降低,也许存储相比于计算处于一个相对的低谷,但数据作为未来智能世界的核心元素,存储行业也必然会随着新存储时代的确立而迎来发展的高峰期。
过去的企业级存储主要有两大类:分别是NAS(网络接入存储)和SAN(存储区域网络)。这两大传统企业存储都有一个共同的特征,就是只能垂直扩展,它在管理、成本、容量和性能方面满足不了海量非结构化数据的存储需求。
客观地说,云、数、智带来的极致容量、极速性能、极简架构、智能管理等方面的技术挑战,对传统存储来说几乎是不可承受之重,而这恰是新存储可以获得高速发展的机会。所以我们看到了多元化的存储类型出现,比如越来越多的应用现在都基于闪存实现,块存储、文件存储和对象存储新一代存储技术层出不穷,再有超融合、海量、AI等技术都在改变着传统存储。
浪潮存储产品线总经理李辉认为,“智慧应用驱动人类进入新数据时代,新数据时代为数据带来四大特征:新数据形态、新部署环境、新应用模式、新价值需求。”在此基础之上,存储其实也发生一些改变。
首先是快。比如AI、工业互联、数据挖掘、实时分析、在线交易,这些新型应用对存储的性能提出了更高的要求,存储必须要保持微秒级的响应、低时延。
其次是高性能。这要求存储系统不仅要满足大量数据的海量存储需求,同时单节点需要支持极高的容量,以及支持多节点的线性扩展。很多传统应用,包括一些新型应用对性能的要求也变得越来越高。例如,某些核心应用已经要求百万级的IOPS、TB级带宽这样级别的性能。
所以,业务为导向将是新存储的核心价值,这也将让存储在数据中心的地位得到质的飞跃。
如李辉所说,依据“云存智用 运筹新数据”的新理念,浪潮存储将在数据中心放大存储能力,为用户带来新价值,从而帮助用户应对新数据时代应用对存储带来的新挑战。
正是基于对业务导向的理解,浪潮基于一套架构,为数据中心打造了两套全新的存储平台。数据中心级高端存储平台AS18000 G5与数据中心级分布式存储平台AS13000G5,帮助用户建设云化数据中心,应对智能应用挑战。
浪潮存储还采用了同一套软件来满足不同客户的需求。针对不同场景,根据客户的不同需求,可以配置成大容量型和高性能型。这就是我所提到的,根据业务的侧重性来进行选择。
新存储的“双模式”
新存储时代,所谓的“新”其实并不代表将“旧”完全颠覆甚至取代,如果站在客户的角度看,它们过去的基础设施投资依然存在价值。这才是浪潮之所以在一套架构下,推出两种存储平台的原因:以客户的业务走向为基点。
比如,数据中心级高端存储平台AS18000G5,定位为关键应用云,覆盖包括在线数据处理。浪潮发现,大量企业拥有自己的数据中心,公有云数据中心占的比例目前并不高,以可靠性为核心需求的高端存储依然有很强的生命力。
浪潮也发现,在以金融为代表的核心机构开始使用全闪存,这意味着关键业务的闪存时代正在来临。所以,浪潮的AS18000G5和HF18000G5,强调了对闪存的应用,分别为混闪存储和全闪存储两个系统平台。
以数据中心级高端存储平台AS18000G5为例,它采用全互联48控,IOPS提升至1500万,延迟降低至0.2 ms,容量最高达282PB,同时采取了融合存储:一套存储,可提供文件/块/对象,三种存储协议。最重要的是在稳定性上,它从电源到风扇、到存储系统和机柜,都是可以冗余的,堪称五星级的高可靠。
而数据中心级分布式存储平台AS13000G5的定位是弹性融合云。这是典型的面向未来云智应用的存储平台,并拥有5+X的技术优势。
在软件层面,它支持5种服务协议(文件、对象、块、HDFS、数据库协议),和X种融合平台;而在硬件层面,它支持5种硬件形态(机架式、高密式、机柜式、多节点式、边缘式),同时,X代表了多种硬件配置(x86机型、openpower机型、ARM机型、GPU、AI等多种配置选型),可实现容量按需扩展、性能按需供给、服务按需定义。
我们知道,高端存储所支持的关键应用市场是稳增长的,从IDC的数据看,一直保持了5%到10%的增长。而分布式存储刚刚打开闸门,是下一代存储发展趋势。所以,浪潮遵循业务驱动为核心,在一套架构之下,既延续了高端存储的应用空间,也为分布式存储的到来做足了准备。