舍恩伯格早在2013年出版的《大数据时代》中就预言了,数据可以量化一切,“文字变成了数据,方位变成了数据,沟通变成了数据,直到万物的数据化。”
在过去这几年中,我们所处的物理世界的数据量的确在迅速的膨胀。华为全球产业展望(GIV)报告显示,全球数据量将从2018年32.5ZB快速增长到2025年的180ZB。
但遗憾的是,这项调查还发现,企业生产活动产生的数据中只有不到2%被保存,而其中得到分析利用的不足10%,数据价值没有得到充分释放。
在过去,数据长久以来都作为企业的资产被保存,但由于缺乏有效的数据处理机制,这些大量的数据,分散于各处,难以联通,就更难以汇聚。而数据的价值在于聚合,分散的数据价值必然大打折扣。
正是为了解决企业数字化过程中,会遭遇的数据接入难、分析难、消费难等挑战。在6月5日,华为正式发布智能数据解决方案FusionData,支持智能的数据全生命周期管理;从数据接入、数据处理和数据使能三个层面,重定义数据基础设施,帮助客户打造领先的智能数据解决方案,拥抱行业数字化,释放数据价值。
三大难题,三座大山
事实上,今天的各种新技术的发展与融合,推动了数据时代的发展。云计算、大数据、AI、IoT、5G等新技术的先后涌现,使得新应用层出不穷,产生了海量的数据、新的数据形态、新的部署环境、新的应用模式。
以银行业为例,某家普通的城商行在过去20年的客户总量一直稳定在300万左右,但近两年通过金融科技的融入,拓展新的业务之后,客户量直线飙升到4000万。可见,新技术拓展了业务的边界,也带来了庞大的数据量。
类似的变化正在各行各业中发生,大量的传统企业借助新技术走向数字化的过程中,数据价值的挖掘就是一道分水岭,翻过去就是一片坦途。
如华为Cloud & AI产品与服务总裁侯金龙所说:“数据成为新生产资料,智能成为新生产力,企业需要构建领先的数据基础设施,从而打通数据供应全流程,使能数据与业务全连接,提升业务敏捷性。”
这句话的关键其实是数据和智能的融合,智能是技术更是方法论,通过智能让数据更好的接入、处理,并做到使能业务。“数据+智能”将是改变各行业各业业务效率的一把钥匙。
华为IT产品线副总裁、智能数据与存储领域总裁周跃峰也表示,“企业在实现数据价值时,会面临数据接入难、分析难、消费难,这三大难题。”
首先,数据接入难是指,企业在庞大的系统中会有上万个数据接入点,同时这些数据接口的协议并不统一,导致了协议转换复杂,数据接入周期长等问题。
其次,数据融合分析难是指,企业在过去长期信息化的过程中,建设了太多烟囱式的系统,不同的接口和不同的开发周期,造成了数据分析链路长,多系统集成难度变大的难题。
最后,数据消费难是指,因为数据在接入和分析所遭遇的问题,导致找数据难,比如在上百万张表中寻找目标数据如大海捞针,再比如取数难,错综复杂的系统结构,步骤多、耗时长,难以形成数据价值。
换言之,如果我们把数据当作智能时代的基础设施,那么接入难、分析难、消费难这三大难题就会极大的限制企业数字化的深度。这就是华为之所以推出FusionData智能数据解决方案的原因。
华为的解题与破题
简单地说,华为FusionData智能数据解决方案,就是从数据接入、数据处理和数据使能这三个层面,重定义了数据基础设施。
第一,在数据接入层面,华为是通过智能数据连接部件ROMA支持多数据源接入、消息和API的统一管理、智能通道选择等技术实现智能全连接,加速数据流动,让应用与数据连接更高效。
不仅可以支持1100多种应用和异构数据源接入,通过开放式数据接入框架可灵活接入第三方数据源,还可以支持分布式消息和API的路由统一配置管理,让数据自由流动,并且可根据数据特点智能选择传送通道,大幅提升数据接入效率。
第二,在数据处理层面,其实包含了三层能力。在多样性算力上,华为有鲲鹏和昇腾芯片级起跳的算力保证;在智能数据存储上,华为有分布式存储FusionStorage;在智能数据分析上,华为有分布式数据库GaussDB和大数据平台FusionInsight。
这三层能力保证了,华为能够通过存储与计算分离技术,打破系统烟囱式建设;通过智能分布式存储的多协议融合技术,实现一份数据同时支持数据库、大数据、AI等多种业务的分析需求,让融合数据分析成为可能。与此同时,融合分析引擎支持数据库、大数据、AI多引擎融合分析和多样性算力统一调度。通过统一架构,降低海量数据处理难度,实现极简分析。
从这个点上,我们也可以清楚的认知,为什么华为的GaussDB可以称之为AI-Native数据库。因为华为在数据处理层面上,做到了从智能芯片起跳,并与智能数据存储和智能数据分析做到了全面的智能。
第三,在数据使能层面。智能数据使能部件DAYU通过智能元数据感知和OneQuery Turbo 技术构建数据处理与业务创新的桥梁,提升业务体验,让业务更敏捷。例如,通过AI技术,自动感知和采集多个系统的元数据,并进行智能化分级分类,生成全局统一的数据视图,数据寻找秒级响应。再有OneQuery Turbo,提供统一的数据访问接口,实现多数据源、多类型数据的统一访问,简化数据加工流程,数据获取速度提升10倍以上。
华为没有秘密,只是将点滴汇成江海
在我看来,华为之所以能够拿出FusionData智能数据解决方案,恰是华为从研发的一点一滴汇聚成江海。
在去年10月份的华为全联接大会上,华为首次发布了两款昇腾芯片昇腾910(Ascend 910)和昇腾310(Ascend310),在今年初,华为又发布了基于ARM架构的鲲鹏920芯片。正是这两次重要的发布,形成了华为智能数据处理的算力底层。
而“条条大路通罗马”的数据接入层的ROMA平台,是源自华为内部信息化建设集成经验,将优秀集成技术和集成经验沉淀在该集成平台上,做到加速应用上云的。涵盖了2B和2C业务领域,既有传统IT也有互联网IT应用特征等多个应用场景,足以满足各种不同类型的企业所需。
GaussDB则作为全球首款AI-Native数据库,将人工智能技术融入分布式数据库的全生命周期,通过异构计算创新框架充分发挥X86、ARM、GPU、NPU多种算力优势。
除了拥有贯穿智能数据全生命周期的核心技术之外,华为也与国内外大量的优秀ISV们形成了创新的生态,在政府、金融等多个大行业做到了聚焦和落地。截至目前,华为智能数据解决方案FusionData已经应用于全球60多个国家及地区,服务于1500多个客户,拥有500多家商业合作伙伴,并广泛应用于金融、运营商、政府、大企业等行业。
不难总结,华为正是通过长期的研发积累,在每一处细节上做到了突破,又将之融合,并于生态合作伙伴共同面向最终用户输出可以落地的解决方案,用“数据+智能”去释放各行各业企业客户的数据价值,让数据的涓涓细流,汇成数字化的大江大海。