近日,博睿数据的智能运维算法平台Swift-AI,顺利通过了由中国信息通信研究院(以下简称“信通院”)开展的《智能化运维(AIOps)能力成熟度模型第2部分:系统和工具技术要求》首批正式评估,通过的“异常检测”模块达到全面级评价。
这代表着博睿数据的智能运维算法平台的产品能力全面性与完善性得到业界认可,同时代表着博睿数据AIOps系统和工具达到国内领先水平。
AIOps将赋能运维,带给用户全新的体验
近10年来,云计算、大数据和人工智能等技术浪潮风起云涌,运维的价值逐渐显现,企业底层IT基础架构愈加复杂化,软件规模量级提高,原来的传统运维方式已经越来越跟不上时代的步伐,此时AIOps应运而生。
根据Gartner的阐释,AIOps通过松耦合、可扩展方式去提取和分析数据量、种类和速度这三个维度不断增长的IT 数据,进而为IT运维管理产品提供支撑。
AIOps的落地在多方面直击传统运维的痛点,AI算法承担起分析海量运维数据的重任,能够自动、准确地发现和定位问题,从决策层面提高运营效率,为企业运营和运维工作在成本、质量和效率方面的优化提供了重要支持。
谈及AIOps的未来发展,博睿数据产品管理部高级总监孙丽表示,随着企业业务规模扩大,云原生与微服务的兴起,企业IT架构复杂性呈现指数级增长。而传统的IT运维手段面临故障发生后,查找故障原因困难,故障平均修复时间周期长等挑战,已无法满足新的运维要求。因此运用人工智能赋能运维,去取代缓慢易错的人力决策,快速给出运维决策建议,降低问题的影响并提前预警问题就成为了必然。AIOps作为目前运维发展的最高阶目标,未来将会赋能运维带给用户全新的体验。
同时孙丽也强调,当前智能运维的很多产品和项目在企业侧落地效果并不理想,究其原因可归类为三点:一是数据采集与AI平台割裂,多源数据之间的关联关系缺失导致AI平台缺乏高质量的数据,进而导致模型训练效果不佳;二是数据采集以Metric和Log为主,导致应用场景较窄且存在数据孤岛问题;三是AI平台能力尚有提升空间。当前落地的场景多以异常检测与智能告警为主,未来需要进一步提升根因分析与故障预测的能力。
因此,在孙丽看来,未来企业首先要建设一体化监控运维平台,一体化是智能化的基础。基于一体化监控运维平台采集的高质量的可观测数据数据以及数据之间的关联关系,进一步将AIOps的能力落地到一体化监控运维平台中,从而实现问题精准定位与见解能力。
可以预见,在新技术的促进下,AIOps成为未来运维发展的趋势,是企业在运维(技术运营)侧的高阶实现。
将AIOps能力融入全栈监控产品线
作为领先的APM应用性能管理厂商,多年来博睿数据积极拥抱人工智能、机器学习等新技术变革的浪潮,并基于AI和机器学习技术,自主研发了“数据接入、处理、存储与分析技术”核心技术体系,全面布局智能基线、异常检测、智能告警、关联分析、根因分析等丰富且广泛的智能运维功能,并将AIOps能力融入端到端全栈监控产品线,可为传统企业提供强大的数据处理、存储和分析的软件工具,帮助客户整合各类IT运维监控数据,实现数据的统一存储和关联分析,打破数据孤岛,构建统一的IT运维管理平台,让企业的IT运维更加智能化、自动化。
在此基础上,博睿数据还依托完整的IT运维监控能力,利用大数据和机器学习技术持续构建先进的智能运维监控产品,2021年先后推出了搭载了AI能力的新一代APM产品Server7.0和新版的统一智能运维平台Dataview,不断落地智能异常检测、根因分析、故障预测等场景。基于人工智能的能力实现运维监控场景的信息整合、特征关联和业务洞察,帮助企业确保数字化业务平稳运行,并保障良好的数字化体验。
为AIOps行业的发展添砖加瓦
事实上,博睿数据能够得到如此认可,也并不意外。博睿数据很早就成立了AI算法研究部,不断加强产品根因分析能力和预测能力,并先后在北京、厦门、武汉等地设立研发团队,并与重点大学达成战略合作,通过共同的科研成果实现算法的升级创新。
未来,博睿数据将持续专注智能运维算法能力平台Swift-AI的研发,不断夯实在异常检测、故障预测、智能告警和根因分析的相关算法与能力突破。
孙丽表示,Swift-AI的能力引擎将赋能博睿数据全产品智能化的体验升级。基于博睿数据的一体化监控能力,可实现开箱即用的AI。客户无需投入较大的人力和时间在收集数据、准备数据、清洗数据上,我们的智能探针能力会根据AI引擎的需要,对Metric、Trace、Log以及相关的关联关系进行数据的智能化采集。基于高质量Telemetry data和强大的算法模型,实现开箱即用且故障定位精准的AI体验,助力更多企业实现数字化智能化转型。
同时博睿数据将不断推进相关能力在技术和功能方面的打磨,致力于与业界携手推动AIOps等新兴领域的标准制定,共同推动行业进步,为AIOps行业的发展添砖加瓦。