『云计算』

华为云BigData Pro:云上大数据进阶新“武器”

前不久,Hadoop三大巨头之一的MapR被HPE收购接盘,此前其正面临运营困难并宣布可能存在关门的风险。对此,有分析称“大数据已死”。显然,这个结论下得过于草率了,事实是与之截然相反。

无论是从全球还是国内来看,数据量一直处于爆发式增长中。据IDC预测,全球数据圈(每年被创建、采集或是复制的数据集合)将从2018年的33ZB增至2025年的175ZB。尤其在国内,预计到2025年,中国数据圈将占全球数据圈的27.8%,成为全球最大的数据圈。

运用数据并使其产生价值是各个产业领域甚至整个社会都在不遗余力做的一件事情,这个过程显然需要更强大的大数据处理分析的能力。回过头来说,如果非要给MapR的落幕得出一个结论的话,那也是原有存算一体架构本身在数据处理分析中所面临的瓶颈和挑战,而非大数据应用。当然,目前存算一体架构仍然在企业数据领域占有重要的位置和一席之地。

所以总结来说,数据仍然摆在那里,如何将数据转变成为企业智能生产力,这个核心诉求一直没有变。那么,是否有一种更好的方法,去提供从数据采集、数据管理、数据分析到业务应用的大数据能力?

华为再次挺身而出,在刚刚过去的重庆智博会上,华为云发布了业界首个鲲鹏大数据解决方案——BigData Pro。这是又一个变革性的产品方案。

华为云BigData Pro,云上大数据新选择

华为云BigData Pro鲲鹏大数据解决方案,从名字就可以看出,这是一套云上的大数据方案。大数据上云?其实不难理解,如今企业上云已成必然趋势。而在公有云上部署更灵活高效的大数据分析平台,也将成为企业的必然选择。

这时,单纯的大数据软件提供商已经很难跟上市场的需求,因为企业需要的不是独立的大数据软件或组件,而是需要一套从数据存储到数据集成再到数据分析挖掘的完整解决方案

华为云BigData Pro鲲鹏大数据解决方案应运而生。基于云服务,华为云BigData Pro提供了完整的端到端的企业大数据应用能力。该方案采用基于公有云的存储与计算分离架构,以可无限弹性扩容的鲲鹏算力作为计算资源,以支持原生多协议的OBS对象存储服务为统一的存储数据湖,提供“存算分离、极致弹性、极致高效”的全新公有云大数据解决方案

基于公有云的大数据解决方案带来的优势也很明显,在过去,企业大多选择自行建设IDC中心和自行部署软件构建大数据能力,这带来的是投资过大、折旧成本高和运营运维负担沉重的压力。

华为云云存储服务总经理林超

华为云云存储服务总经理林超表示,大数据上云后,无论是云服务器还是云容器,亦或EI大数据服务,计算资源可以实现弹性扩展,企业无需再为闲置的资源买单。

无疑,大数据上云带来了显著的成本降低。而说到成本,接下来就不得不提华为云BigData Pro鲲鹏大数据解决方案的一个最核心内容“存算分离”。

从存算一体到存算分离

众所周知,目前大数据行业大多采用基于Hadoop的架构演进而来的开源或者商用的大数据软件。它们有一个共同的特点,即存储与计算是融合的。也就是说,IDC中部署的大数据方案计算和存储资源的配比相对是固定的,也就意味着每一台服务器提供多少算力,同时也提供多少存储容量。这样的大数据架构无法实现资源的单独扩容,造成资源的浪费。

而在实际应用中,由于计算和存储的利用率差异大,导致大数据平台的建设使用成本居高不下

所以,这也在一定程度上说明了,在数据量不断增长的背景下,一些大数据软件或者服务厂家发展受到限制的原因,就在于无法有效满足市场需求的变化。

在BigData Pro的方案中,华为云基于云服务的天然优势,推出了存算分离的架构,带来的好处显而易见,就是存储和计算可以灵活配置,单独扩容,让大数据集群的计算资源利用率提升75%,综合分析成本可最高降低50%

鲲鹏释放大数据极致算力

华为云BigData Pro鲲鹏大数据解决方案的另外一个核心是“鲲鹏”,这是最近在和华为相关的新闻中出现频率比较高的热词。

首先,它代表着最佳适应大数据场景的鲲鹏算力,其具备两个优势:一是鲲鹏CPU的多核使得具备较强的并发能力;二是CPU内存通道从6个提升到8个,支持的内存速度更高,从2666MHz提升到2933MHz,内存带宽提升46%,内存带宽的提升对于大数据场景的应用优势非常明显。

其次,基于鲲鹏算力,华为云BigData Pro率先采用鲲鹏云容器技术,充分发挥极致弹性性能,算力可无限扩展。借助Serverless架构优势和华为自研的高性能容器批量计算平台Volcano,鲲鹏云容器的发放速度可以达到每秒1000台,提升了10倍;高性能容器网络降低容器间通信时延,转发效率超业界50%。

在华为云看来,基于鲲鹏算力和架构,提供了适用于当前大数据应用的性价比最优的解决方案

以OBS对象存储服务完成大数据进化

如果说存算分离并不能完全体现华为云BigData Pro鲲鹏大数据解决方案的优势,那华为云利用智能云存储对存算分离大数据解决方案进行优化,则再一次拉开了与同类方案的距离

在华为云BigData Pro鲲鹏大数据解决方案中,OBS对象存储来管理企业海量数据。BigData Pro的三点优势就体现在其中:

第一,华为云实现了OBS对象存储服务的多协议互通,支持HDFS、POSIX和兼容S3等多协议访问,这是一个比较难的技术点,也是最有竞争力的一个点。它实现了让大数据应用可以直接读写OBS,无需协议转换,数据之间互通共享;且可以避免数据多次转换或拷贝,大幅提高分析效率,存储利用率提升140%。

第二,华为云基于对象存储优化了修改写和追加写模式,传统上的修改写相当于新增一个数据后,然后把老数据删掉,这种做法在遇到大文件时,增加了操作时延,而华为云可以做到直接修改写。

第三,华为云在OBS对象存储中实现了HDFS原生接口,并且性能更好,支持千万TPS超高并发,2.4Gb/s单流带宽,精准满足Hadoop大数据应用场景对高性能云存储的需求。

所以说,也许同样是存算分离,但在高并发性能的鲲鹏算力、架构以及支持原生多协议的OBS对象存储服务的加持下,华为云BigData Pro鲲鹏大数据解决方案有着自己独特的竞争优势

据了解,目前,华为云已经将这样的方案落地到游戏直播、广告营销等行业,并且能够满足互联网(智能推荐、客户分析),金融(信用、风控),电信(客户画像、运营决策),卫星气象(大数据量实时分析),政府(行政提效等)一系列大数据场景应用。

此外,华为云BigData Pro鲲鹏大数据解决方案支持当前最主流的大数据生态,所以对于企业来说,无论是使用的开源Hadoop版本,还是商用Hadoop软件,都能以近乎0成本改造,把业务平滑移植上到BigData Pro上。

重新定义大数据未来,加速企业大数据应用,华为云BigData Pro鲲鹏大数据解决方案,为千行百业应对大数据处理分析,实现智能化转型升级,提供了一个更佳的云上新“武器”

华为将以算力为王?亦或将发布服务器操作系统?

上一篇

十倍增长,ZStack阿里云版如何炼成了专有云中的爆款?

下一篇

你也可能喜欢

热门标签

微信扫一扫

微信扫一扫