日志易智能运维 V1.7新版发布,构建智能化全栈指标监控体系

日志易智能运维 V1.7新版发布,在指标体系整合、指标探索、日志异常检测等方面进行了优化,全面提升了日志易智能运维AIOps从基础架构->操作系统->中间件->业务应用的全栈监控能力,并且重点优化了多个页面布局,帮助客户建立全栈监控体系。

指标树

在旧版本中,三列式的展示局限性较强,无法全面展现日志易针对不同层级IT架构的指标监控能力。

智能运维 V1.7调整布局,形成了指标树,用户可以方便快捷地对监控指标进行过滤、搜索、展示、探索和分析等操作。

指标树示例图

如上图所示,智能运维 V1.7还内置了指标体系的特点,指标集内置第一层级分类升级为基础设施、操作系统、中间件、数据库和业务。

在指标探索方面,新版本支持用户对多个指标进行对比且查看评价报告,还支持多种聚合函数,通过对原始指标进行计算产生衍生指标。

指标对比示例图

新增服务健康度设计模式

旧版本已经支持服务健康度模式的自定义,新版本引入SRE黄金指标的概念,新增了SLI模式。

在智能运维 V1.7中,明确了一个服务的SLI是指请求量、错误率和响应时间,只需配置以上三种对应指标的特定序列即可。此外,系统会根据以上配置,自动适配运行更合适的异常检测算法。

SLI模式示例图

丰富服务视角

智能运维 V1.7版本对服务相关页面进行了全面优化,以服务树的形式展示服务,丰富了服务的视角,用户可以清晰地查看服务相关指标、核心监控项、异常日志、关联设备以及拓扑关系等。

服务详情示例图

指标批量训练

在之前的版本中,当用户针对某些指标进行手动异常模型训练时,往往需要对逐个指标进行训练。

智能运维 V1.7支持多个指标批量训练,用户可以根据指标名称和属性过滤结果,在列表中批量选择指标进行训练,充分减少不必要的重复操作,大幅提升指标训练的高效性与智能化。

指标历史任务

在旧版本中,当自动训练的任务异常失败时,用户很难有针对性地调查追踪。

智能运维 V1.7版本新增了指标相关历史任务展示,能够展示最近100个任务的状态,包括原始指标或衍生指标的计算任务、训练任务、检测任务等,让用户能清晰明朗地了解到指标历史任务状态。

指标历史任务示例图

如上图所示,如有任务执行失败,用户可以直接点击查看错误详情,快速了解任务失败的原因。

日志异常模型训练性能优化

智能运维 V1.7版本对日志异常模型训练的性能进行了优化。

在训练的日志数据量较大的情况下,新版本的训练耗时相对来说大幅缩减,参数模型训练效率提升了数倍。

其他优化

  • 服务配置和详情页面进行了大幅UI优化,例如支持用户给服务添加额外信息,支持服务的启用或禁用操作等。
  • 在配置页面新增了新建设备、新建日志任务等入口,让用户能够更便捷地关联服务相关信息。
  • 在原始指标的基础上,新版本提供切分功能。用户在开启切分序列功能时,可以选择保留独立的聚合指标数据;此外,新版本支持用多个分组字段进行切分。
  • 在新版本中,日志模式解析支持中文分词。