信通院:日志易首批通过可观测性评估,获评稳保计划首批“稳定性守护者”
4月26日,由中国信息通信研究院(以下简称“中国信通院”)主办的“稳保计划”首届云系统稳定性大会在京召开。会上,中国信通院公布了“稳保计划”云系统稳定性领域的最新评估结果,公开了首批“稳定性守护者”成员名录。
作为国内首家落地可观测性平台与解决方案的企业,北京优特捷信息技术有限公司(以下简称“日志易”)成为了首批通过信通院可观测性平台评估的企业,并获评信通院稳保计划首批“稳定性守护者”。
信通院“稳保计划”
中国信通院副院长魏亮在致辞中指出,随着云计算的发展和国内企业上云进程的加速,云服务的稳定运行是企业发展的重要保障。信息通信管理局应急通信与互联互通处处长张牙表示,党的十八大以来,以习近平同志为核心的党中央高度重视安全生产工作,云服务的运行稳定已经是信息通信行业安全生产的重要组成部分。
为提升云服务稳定运行水平,加强企事业单位系统稳定性保障工作,中国信通院于2022年3月初发起了“云系统稳定性保障计划”(以下简称“稳保计划”)。截至目前,“稳保计划”吸引了金融、云服务商、互联网、通信运营商、零售等不同行业的20余家头部企业和机构参与,并完成了包括可观测性平台在内的多项云系统稳定性相关评估。
日志易可观测性平台——观察易
基于自研数据搜索引擎Beaver和低代码编程语言SPL(Search Processing Language),日志易自主研发出国内前沿的可观测性平台——观察易,已获得7项可观测性相关专利。
观察易能够从业务、服务、接口、设备四层维度对应用系统进行分析,接入基础监控指标和业务分析日志数据后,通过梳理业务层面的依赖关系,展现出全面准确的可观测性内容,帮助客户了解并实时监控应用系统运行状态。
观察易可应用于运维监控、链路追踪、指标探索及故障定位等场景,通过加强日志、链路、指标三类关键数据之间的关联,更快地发现问题并发出告警,同时更快地实现故障根因分析,从而缩短MTTR,有效提升运维人员效能。另外,观察易还支持通过智能机器学习进行故障预测。
应用场景
运维监控
在“业务至上”的互联网时代,DevOps需要持续监控业务状态,当故障发生时需要快速找到根因并进行修复。观察易能够从业务维度对业务的平均耗时、请求量、错误数、成功率四个黄金指标进行监控,也可以从服务和接口维度对业务的整体状态进行分析。另外,观察易也提供和业务无关的服务监控、接口分析和设备监控,实现更全面的系统可观测性。
链路追踪
伴随企业IT由传统架构向分布式微服务架构转型,复杂单体应用被拆分为多个轻量级服务。由于服务间的独立性,一笔业务会涉及到多个微服务系统。观察易可对接trace日志,实现业务链路追踪,通过观察易的拓扑图、历史回溯、蓝本对比及指标趋势图等了解业务详情,快速定位故障,让IT运维人员更准确、高效地掌握微服务环境下业务的运行状态。
指标探索
从业务、服务、设备角度来说,侧重的是黄金指标可观测性,如果需要关联黄金指标对比观测或需要关注黄金指标以外的其他指标时,运维人员可以使用观察易的指标探索功能,对时序数据进行单指标多维度(平均值、最大值、最小值等)或多指标多维度查询、分析并实现可视化。
故障定位
观察易能够提供标准的起点或图表来帮助运维人员查找问题,分别从业务、服务、接口、设备的概览追踪到其详情,进而结合调用链的span信息或其他日志信息定位到故障原因。