在刘大鹏30岁生日的当天,他偷偷许了一个愿望:希望有一天,能够像他的偶像乔布斯一样,在舞台上给更多人介绍必示。
一年多过去了,这位必示科技联合创始人&CEO就实现了这个“小目标”。在8月28日“2019智能运维技术应用大会”的舞台上,刘大鹏亲自发布了国内首款多场景、可编排智能运维平台——必示智能运维平台。
刘大鹏似乎离梦想更近了一步,但其实智能运维这条路,他已经走过了近十年,算得上是智能运维领域的“先行者”。刘大鹏博士毕业于清华大学计算机系,正是为了将在清华积累的智能运维知识转化为生产力和价值,必示科技在这样的背景下成立了。
“运维这个行业本身就是一门苦差事,智能运维很多时候被认为只是锦上添花,但在必示看来,智能运维会一定会大有可为,也是我们毕生追求的方向”。刘大鹏说。
我们先把智能运维拆分成,智能和运维,这两个词来分别分析一下。
运维,首先是一个关键的主体。从商业的角度,运维要做的是保障业务能够可靠、高速、高效、安全地运转,因为它会直接影响到业务的收益和成本。但运维的部门往往又并不是业务的创新部门,所以运维常常是被忽视的那个角落。
而从宏观市场的角度看,随着5G和云的发展,到2020年全球将有接近1000亿的设备,会承载无数的服务,涵盖互联网、金融、物联网、智能制造、电信、电力网络、政府等等的生产生活的方方面面。这让运维变得越来越重要。
从运维的发展的过程看,最早出现的是手工运维,在大量的自动化脚本产生后,就有了自动化的运维,然后慢慢衍生出了DevOps和智能运维。同时,在运维不断升级的过程中,也总结出流程化的东西:产生海量的监测数据,进行分析决策,并通过自动化的脚本进行控制。
实际上运维的发展过程,主要是分析决策步骤发生了变化:起初,由人工决策分析;后来,在采集数据的基础上,使用自动化的脚本进行基于规则的决策,最后,用机器学习方法做决策分析,这就是智能运维的由来。
调研公司Gartner的报告显示:智能运维相关的技术产业处于上升期。2016年,AIOps的部署率低于5%,预计2019年AIOps的全球部署率可以达到25%。这个数据很好的证明了清华大学裴丹教授的观点。
与此同时,智能运维对行业的改变也将是天翻地覆的。传统运维是低门槛的,而智能运维需要开发数据采集程序以及自动化执行脚本,负责搭建大数据基础架构,同时实现高效垂直的机器学习的算法,将导致门槛变得很高,也会推动智能运维成为企业重要的IT投入之一。
这样的发展趋势正是智能运维的技术倡导者们所期望看到的。“产业生态化、数据多样化、场景多样化、场景精细化、算法服务化、技术平台化、落地加速化、成熟度评估标准化,这些大趋势会助力AIOps在今后的几年飞速发展。” 裴丹教授说。
而对于必示而言,抬头看天,低头看路,脚踏实地,一步一个脚印让AIOps在行业落地,则是其未来走向商业成功的关键。
对刘大鹏来说,智能运维本身就是他在清华大学读博士时期所专注的方向,能够学以致用,并使之成为事业的目标,这不仅是刘大鹏的幸运,更是智能运维整个行业的幸运。
作为《企业级AIOps实施建议白皮书》和《金融业AIOps实施建议白皮书》的作者之一,刘大鹏坚信实践是产品的基础。“我们今天的成就,离不开所有客户的支持,智能运维的产品是和场景深度结合的技术,很多技术实际上是必示与客户一起打磨出来的。”
从实践中来,再回到实践中去,刘大鹏对智能运维的产品观就这样一步步积累起来。刘大鹏表示,“必示智能运维平台的价值主张,有三个关键词:垂直、专业、开箱即用。”
简单说,就是用开箱即用的算法去适配垂直的行业。但说起来简单,做起来却并不容易,最难的就是算法。
首先需要研究型的人才,智能运维产品的开发与传统软件开发有很大的区别,它需要结合复杂场景进行大量前置性研究工作,比如问题定义、技术调研、数据实验等等;其次,从事智能运维的人需要具备两方面的知识储备:AI相关知识和运维领域知识。其三,每个场景和算法的研发都需要持续投入很长时间,解决各种真实环境中的问题,持续优化,这样才能做出鲁棒性高的算法方案,才能实际投产使用。
只有达到这些复杂的条件,才能实现必示的价值主张——做开箱即用的运维算法。
不难发现,所谓“开箱即用”其实将复杂的工作留在了产品的研发和磨砺上,而复杂过后,留下的简单给到了用户,这其实很好的形容了智能运维的魅力。
而这种“复杂”也远比想象中来得更高,刘大鹏说,“在算法形成的过程中,会遭遇很多挑战,比如:算法种类和所分析的数据种类不断增加,系统如何保持可扩展性?算法和数据间需要按需组合,在实际使用中,不同部门、不同团队面临的不同的运维场景和数据,如何方便地组合算法和数据?怎么把算法灵活地串联起来,去真正打通运维场景的多样算法需要?”
为了解决这些根本性的难题,在原有的开箱即用的运维算法基础上,必示再增加一类能力:基于运维知识图谱的平台化。在平台化的过程中,必示把算法、图谱、数据这三个关键元素结合在一起,来进行数据关系的管理,同时可以做算法的编排和整合。
最终实现了“智能运维平台”产品的落地。据了解,必示的智能运维平台中整合了大量智能运维领域中垂直的算法,同时有智能事件中心,把故障发现和故障定位的算法串到一起。进一步满了客户快速交付的需求。
事实上,必示的智能运维平台也是一个不断演进,优化的产品,它有这样几个优势:
第一,智能运维平台的算法并不是简单的开源算法,而是在大量运维场景和运维数据中,打磨了一两年的专业垂直算法,才可以做到真正的开箱即用。
第三,俱备足够高的性能,一个大型企业监控数据每天都会达到TB级甚至超过10TB,这样一个量级数据的分析,需要高性能的架构进行支撑。
第四,最大程度上减轻人力的困扰,在算法调优上,算法的参数可以根据数据自动适配,人工只需要做简单的配置即可。
第五,智能运维平台,这套系统已经在必示很多标杆客户中投产和运行,代表了目前运维的最佳实践,也蕴含了大量运维经验,可以被很多新的行业客户直接开箱即用。
不难总结,必示智能运维平台的发布,是刘大鹏和他的团队过去10年在智能运维行业深耕,踩过了许多坑,解决了大量困难所总结出来的方法论。它与市场上诸多挂着“智能运维”旗号的产品和公司有着本质的不同。
我们知道,大部分其他做智能运维的公司是做监控或是做APM起家,他们的运营逻辑偏重于传统软件工程师文化,核心的技术人才一定是围绕主要业务展开,而真正既懂算法又懂开发的人才通常不会去做运维,导致智能运维人才非常匮乏。
如刘大鹏所说,“不同于其他公司的智能运维只是其主流产品上的锦上添花,必示是专注于智能运维,并更聚焦在分析这一层,我们认为这是很多客户最急需的,也是必示差异化的竞争优势。”
的确,必示绝对是智能运维行业精英团队的代表,在人才方面,必示有10位智能运维方向的博士,十几位经验在10年以上行业资深专家,有50%的成员来自清华大学。同时,必示的专注也得到资本方面的认可,从成立之初到现,必示已经完成了三轮融资,这些一线的资本在投资时会对必示进行360度的考察,也是对必示的综合实力的把关和验证。
刘大鹏说,“必示的定位,其实是垂直智能运维行业的智能算法的公司,我们认为,AI在落地时一定要找准场景,运维本身就是一个好场景,其次AI一定要垂直,所以必示投入了大量的人才和时间,来帮助客户把这件事做到最好。”
我们常说,专注背后处处蓝海,而必示这样专注于智能运维行业的智能算法的公司,本身也是行业内不可多得的,有独特竞争力的公司。在智能运维行业逐渐成熟,并主流化的未来,必示的成长空间的确不可限量。