『新基建』

大数据你好,欢迎来到TaiShan的世界

这似乎是科技公司的一项传统——“吃自己的狗粮”。它通常意味着,将面向目标市场提供的创新方案,首先用在自身同类业务的实践中。说服自己,也说服客户。

这样做的好处是显而易见的。它免去了为技术创新寻找“吃螃蟹”式的最佳实践,让新技术方案出生时,即自带光环——应真实的业务场景需求而生。

华为在杭州举行的智能计算大会现场。

在过去的1年多时间里,华为的手机终端部门、全球服务部门都吃了这样一顿丰盛的“蟹宴”。他们部署了同一个大数据解决方案,来满足内部对非结构化数据处理需求。

截止目前,这个被称为TaiShan的大数据解决方案已经在华为以上两个部门中上线了超过2000个节点,并稳定运行超过1


“最用芯”的服务器

如果你熟悉今天华为手机在全球的市场地位,你就能想象出TaiShan诱人的一面。它是一个重要的业务支持——华为手机全球前三的那枚“军功章”,有它的一份。

有趣的是,手机业务与TaiShan的联系不止于此。华为ARM业务最早就起步于华为智能手机业务,进而进入了IoT和边缘计算,最终到TaiShan,才真正走进了数据中心——这对应了一个从移动互联网应用需求起步,并最终发展起来的巨大市场空间。

华为中国智能计算业务部总裁万志在发布会中发表演讲:《芯开始,让智能计算无所不及》

非结构化数据从传统互联网时代发轫以来,就因为对分布式存储和并行技术的高要求而被视为“另类”。无论是互联网公司,还是传统ICT科技公司,都早早意识到了它的“钱景”,并开始为满足这一巨大的市场需求而投下了重金。

华为2018年投入研发的经费约1000亿元。今年1月的那次发布,让人们得以管窥到了这一投入规模的意义。该月中,华为推出了自研7nm工艺的鲲鹏920 ARM处理器系列。

其中,32核2.6GHz的3226规格,对标了业界主流芯片的中端CPU;48核2.6GHz的4826规格对标了业界主流芯片的高端CPU;64核2.6Ghz规格的极致高性能,CPU的SpecInt性能值提升超过2倍,超越了业界原纪录。

ARM是华为三大计算平台战略布局中的一个,此外还包括了x86和AI计算平台。三大平台共同构成了今天华为对“端、边、云”全场景计算需求的布局。华为也基于此构建了其独特的全栈全场景AI解决方案。

“华为智能计算已经发布了算、存、传、管、智五大自研芯片,而TaiShan服务器是华为智能计算这五大芯片里面‘最用芯’的服务器产品。”在4月26日杭州举行的智能计算大会中,张熙伟丝毫没有掩饰他对TaiShan的情感。他是华为智能计算业务部TaiShan&Atlas领域总裁。

华为智能计算 TaiShan&Atlas 领域总裁 张熙伟

TaiShan服务器即是搭载鲲鹏ARM处理器的服务器系列——这些新产品以不同的性能和能耗优势,覆盖了用户对大数据、海量存储和HPC平台等多场景应用需求。

在杭州的智能计算大会中,华为同时发布的TaiShan服务器五大解决方案,包括了大数据、分布式存储、ARM原生、高性能计算和数据库等应用领域。

“应用场景的多样性带来数据的多样性,没有一个单一的计算架构能够满足所有场景、所有数据类型的处理。”华为中国智能计算业务部总裁万志在会中认为,“多种计算架构并存是未来计算的发展之路。”


TaiShan的世界

不难想象这次杭州会议对行业的吸引力。对比传统互联网,移动互联网已经通过数据结构的变化,向业界明示了实时处理能力和大并发带来的改变——它向下要技术支持,向上提供业务创新。

手机银行APP是这样的一个典型。除传统的网上交易,各类线上业务办理、购物服务、金融服务,甚至资讯服务的出现都为数据处理能力带来挑战。

华为发布TaiShan解决方案现场。

多种技术被用来配合和支撑这种改变,包括批处理、内存计算、交互式查询和流式实时处理等——它们又推动了Yarn、ElasticSearch、Storm等组件的发展。

作为传统互联网典型代表,在Google开启大数据元年之后,移动互联网带来的这些改变被业界普遍视为大数据第二阶段的典型特征。

现在,第三阶段正扑面而来。物联网的兴起,以及正提供无限遐想的人工智能技术等,被普遍认为将为我们带来一个“完全数字化”未来。

这个未来中,高并发等适配大数据技术特征的处理能力被视为关键。这也是分布式计算模型MapReduce成为主流计算框架的原因。

该框架的原理是将大数据量切分成多个独立的、较小的数据集,从而实现对大数据量的分布式处理。

它支撑起了许多大数据多元化的应用场景需求。这些场景包括了大数据离线分析、冷存储、全文检索、实时流处理等。

在如离线分析这一大数据核心应用场景中,系统会采用三副本存储温数据。这就对应要求了硬件设备的特征——中端计算能力CPU和均衡型SATA大盘存储。华为的鲲鹏920 TaiShan 2U双路均衡型服务器即为此而设。

紧贴应用场景需求的产品设计同样体现在了其他大数据应用场景中,包括如针对冷数据存储场景,华为推出了TaiShan 5280 4U双路服务器,该款产品单节点提供了40个SATA盘位。


生态支持下,刷新性能数据

这些ARM服务器产品和主流商用OS、编译中间件,以及上层多个大数据平台,共同构成了今天华为的TaiShan大数据解决方案。

其中在OS层,华为TaiShan大数据解决方案目前支持主流商用OS,包括RedHat、CentOS、SUSE、Ubuntu等;同时也支持国产化OS,例如中标麒麟、深度等。

同时,除开源大数据平台,该方案还支持包括华为FusionInsight大数据平台、全球范围内领先的Hortonworks HDP平台,以及行业合作伙伴的大数据平台,如运营商的苏研大数据平台、安平行业的锐安大数据平台、美亚大数据平台等。

TaiShan在华为内部业务中的表现,很快吸引了用户的注意。

2018年,华为TaiShan FusionInsight解决方案中标北京安平某大数据平台项目,成功交付1000多台大数据集群,主要场景覆盖了全文检索、离线分析等。

此后至今,TaiShan大数据方案陆续在浙江、四川、天津、昆明等多个大数据项目中落地。

这些案例都基于之前发布的鲲鹏916处理器构建。华为数据显示,相比主流平台,该方案为用户带来了10%的性能提升。

在最新鲲鹏920发布之后,这一数据被大幅刷新。在业界通用的benchmark测试中,新方案在离线分析、全文检索、实时流处理、交互查询中,业务性能相比对标业界主流平台提升了15%~30%.

一个好消息是,即便你是已经部署有大数据集群的用户,你仍然可以享受到TaiShan的这些优势性能——该大数据方案可支持TaiShan与X86的融合部署,可以帮助用户在已有的大数据集群上使用TaiShan服务器,并平滑、无缝地扩容,保护用户前期的数据中心资金投入。🖋




华为安全:从平凡到不凡,从不走捷径

上一篇

TaiShan移动办公:让ARM原生场景行走云端

下一篇

你也可能喜欢

热门标签

微信扫一扫

微信扫一扫