直入主题。“数据湖”不是湖。多源渠道、复杂格式的海量数据涌入,汇集而成“数据湖”,但其定位和价值终究不只是“湖”。“数据湖”已经成为企业数字资产的操作系统,也正在驱动应用场景创新。当然,数据湖还颠覆升级了“数据服务商”的业务模式。
传统IT生态中,并没有数据服务商的定位,但现在已是不可缺失的角色,文思海辉即是以数据服务见长的IT服务厂商。2018年,在IDC《中国银行业IT解决方案市场份额》报告中,文思海辉雄踞中国市场份额第一,并以其对金融应用场景的理解,尤其是在数据规划、数据应用、数据治理、数据分析、决策支持等方面的优势,多年保持着“商业智能与决策支持管理类解决方案”市场份额第一名。
【在刚刚结束的2019年中国国际服务贸易交易会上,文思海辉·金融基于大数据的企业级数据湖平台荣获“科技创新”服务示范案例奖】
“数据湖是套先进的企业数据架构。”陈圣,文思海辉金融事业群商业智能事业部总监,他更希望以数据战略的视角,解释“数据湖”的价值定位。其实,“数据湖”概念兴起于2010年,最早被制造行业用户所接受,因为此时制造型企业不仅在汇集ERP、CRM等系统中的结构化数据,也在接入MES系统数据,采集物联网传感器、视频监控系统中产生的非结构化数据。
2014年之后,数据湖的价值也逐渐被金融行业客户认知。原因几乎相同,银行已经不满足于只对“总账”中的数据进行分析。将人脸识别技术应用于存取款,或自助办理信用卡业务,需要存储图像数据;办理个人信贷,需要接入微信、支付宝等第三方互联网渠道数据;办理企业授信要分析工商、税务等社会数据。
此外,将各类票据通过OCR技术进行图文转换;通过物联网终端模块,建立“电子围栏”,进行抵押品监控,以及5G智慧银行、VR证券及金融交易等应用,都伴随着海量数据的涌入。也就是说,每一次金融科技创新,每一项金融服务的推出,都在对传统数据存储、数据分析架构的挑战。
此即为“数据湖”产生的背景。当企业意识到数据是生产资料时,其就有动力将数据进行存储。当企业进一步意识到数据是核心资产、甚至是产业资本时,其就更有动力对数据进行分析。
当然,早期数据湖就是“湖”,更强调数据“存储”,将热数据、温数据、冷数据等不同类型的数据,将结构化、非结构化、半结构化等不同格式的数据,分别存储于SSD、SAS、SATA等不同存储介质中,即实现数据统一存储。
“但数据湖更应该成为业务创新的支撑架构。”陈圣跳出“存储”界面的限制,从两个维度解释了数据湖的价值:以技术维度,数据湖是企业高效的数据底座,涉及数据接入、数据存储、数据治理、数据分析等,不同“模块”的软硬件系统。但以业务维度,基于数据湖的数据服务,又在驱动企业预测决策模式创新、应用场景创新、商业模式创新。
进一步聚焦金融行业应用场景。数据湖正处于从解决“数据存储”,向提供“数据服务”的演进阶段。与诸多行业的应用系统建设思路相同,早期金融行业也采用“业务应用先行、科技部门代管”模式,即市场营销、风险防控等部门,以业务驱动,率先建立部门级大数据平台,由此系统中逐渐沉淀下“部门级”数据。
“但建立‘全行级’数据湖,才可能实现以数据服务驱动的业务创新。”陈圣说。此前,文思海辉已经服务于国内十余家银行的数据湖建设,形成从顶构咨询、项目实施,到数据分析、数据服务等端到端业务能力,而建立“全行级”数据湖就是文思海辉的业务实践。
金融机构建立数据战略,即需要形成数据湖顶层设计,但顶层设计又不只是建立数据接入、数据存储、数据治理、数据分析等端到端的技术架构。
”
文思海辉金融事业群商业智能事业部总经理杜啸争说:“数据服务才是企业应用的制高点。基于数据湖的建设,可解决传统数据仓库,开发周期长、业务迭代缓慢等问题,能够让业务部门和科技部门,更集中精力于自身核心能力。而数据服务商则需要以逆向思维,了解各业务部门的数据需求,形成逐步演进的数据湖建设规划,并有能力阐述数据服务的创新价值。”
如何理解?“金融服务无处不在,就是不在银行网点。”银行创新教父布莱特·金所说的不是变化,而是金融业务模式创新面临的压力。而数据湖就可帮助银行推出更敏捷、更温暖、更具创新价值的金融服务。
目前,基于数据湖形成的数据服务,已广泛应用于风险防控、反洗钱、用户行为分析等应用中。举例说明,对公授信,不仅要接入行内数据,还要接入工商、税务等社会数据,这样才能进一步降低风险级别。个人信贷,通过微信提交申请,银行则快速分析多维度数据,并输出服务——贷款额度究竟是15万,还是30万元。
上述两个应用场景,即是以数据服务驱动的业务创新,但数据湖的价值还不仅如此,其不只在优化现有应用场景应用,更能够快速响应未知需求。央行进行利息调整,通过数据湖即可完成企业画像,快速输出有针对性的金融服务。个人在手机银行或网络银行中查阅理财产品信息,通过数据湖即可立即完成用户画像,实时推送相关产品和服务。
“或许5年前,银行只要求获得T+1数据,但现在营销、客服、风控等业务部门,更希望获得实时数据,”陈圣说。“这也是文思海辉的核心能力之一,以业务为导向,以场景为导向,提供综合的数据管理和实时的数据处理能力。”
“就某种意义而言,数据服务商的价值就如物流企业,物流企业根本不知道库存中,手机的用户是谁,但只要订单下达,就可立即组织配货。”陈圣说:“同样,金融机构也在实时产生未知需求。”
谁也不知道,下一秒业务人员需要什么数据,谁也不知道,下一秒应用场景需要什么数据组合。“但脱离了传统应用系统开发模式,文思海辉已经具备快速数据采集、分析能力,从不同的‘库房’中采集数据,并组装成为数据服务,这才是以应用为导向、以场景为导向的数据湖价值。”陈圣说。