财务公司业务系统日志分析场景
财务公司涉及多个业务系统,而且经过很多工程师对代码进行改动开发,导致日志记录缺乏规范化管理,日志格式种类繁多、不统一,个别业务系统记录了多种时间戳格式(甚至有些业务系统并未打印年月日信息)
需求和痛点
海量的错误日志信息
财务公司业务系统中存在海量的错误日志信息,无法通过人为从中筛选重要的错误日志信息,而且日志定期打包处理,导致相关负责人员通过日志处理问题效率低下。
重复交易问题难以发现
财务公司之前遇到了几种交易重复的问题,比如网银端重复指令、财司端重复指令等。这种重复问题并没有明确的系统报错,所以很不容易被人们发现,给业务系统带来了很大的安全管理风险。
分析内容
业务系统错误信息分析
使用日志易之后,将财务公司业务系统日志进行接入,并且将不同的业务系统以不同的appName和tag进行分类,将业务人员提供的错误日志信息进行提取,通过多重筛选之后将各类业务系统最值得关注的日志信息进行次数、趋势、详情等多个图表进行展示。
业务系统耗时分析
在部署和使用日志易之前,财务公司各个业务统计的耗时均为数据库自动计算生成的时间,被技术人员反映该时间缺乏准确性。我们在分析日志过程中,通过搜索交易的开始及结束字段对业务唯一标识进行关联查询,就可区分每一笔业务的开始及结束时间,从而计算出每一笔交易产生的实际耗时。根据耗时分析,我们可以计算出每一笔交易的最大耗时,最小耗时以及平均耗时并将耗时较高的业务排名与历史同期的趋势等进行分析。
中间件分析
针对WAS日志及Zookeeper日志进行了性能分析,例如WAS日志接入并展开分析,通过对GC(垃圾收集器)的日志进行字段解析能够分析出GC的耗时、GC回收之前空闲内存占比等。通过这些字段可以生成趋势图,统计出一天内垃圾回收的次数,以及每天GC的平均耗时、最大耗时、最小耗时,通过对WAS耗时分析可以帮助运维人员分析GC进行垃圾回收时,哪些时段的耗时超出了平均耗时,从侧面反映了系统进行垃圾回收的性能。
重复交易问题解决方案
针对重复交易这一系列重大安全管理风险事件,我们花费了大量时间去研究分析这类日志,将发生重复的这一笔业务和多笔正常业务进行多角度对比,根据得到的相同点和不同点总结出这种重复问题发生时日志的规律性。通过SPL语句准确的定位到发生重复指令时出现的单号,系统可以在重复问题再次出现时第一时间进行告警通知。
服务器性能分析
通过接入业务系统所在服务器的操作系统性能日志进行实时监控,能够分析核心业务系统服务器的CPU、内存、磁盘使用率、磁盘IO使用率、进程占用CPU情况、网卡流量等分析指标,通过对操作系统性能日志进行分析,可以监控当交易高峰期时,根据核心业务系统所承载的压力,查找产生高负荷的资源使用的主机,对主机操作系统性能的使用情况进行关注,并可通过配置监控策略进行告警。
该场景解决的问题
提升了监控告警能力
系统性能监控告警
将客户所关注的系统性能、中间件性能数据定义阈值,配置字段统计告警,当系统性能达到阈值时进行短信告警。
错误事件数告警
根据配置关键字搜索条件,配置事件数告警,当核心业务系统触发告警条件时进行短信告警。
重复交易指令告警
根据财司端业务系统重复可疑指令日志的分析结果,配置为事件数告警,当再次发生重复可疑指令的日志结果时,将以短信形式告警。
分析性能得到提升
该部分输入介绍: 1.class=preview-solve-the-problem-card-right-text-row-icon-title-row的为内容组件, 2.可以通过修改style部分的font-size或font-weight来调整文字样式 3.1rem对应100px,左侧卡片对应的font-size分别为0.22rem 0.18rem,font-weight分别为500, 400
优化各个图标的SPL语句,搜索过慢的使用定时任务,采集定时任务的结果再进行分析,使得搜索速率更加迅速。
案例来源
北京朗维计算机应用技术开发有限公司
北京朗维计算机应用技术开发有限公司成立于1998年11月,注册资金5000万元,是一家专门从事网络安全、基础架构、系统应用、业务增值等系列IT集成与服务的高新技术企业。北京朗维计算机应用技术开发有……
想了解更详细的内容
点击咨询
财务公司业务系统日志分析场景
财务公司涉及多个业务系统,而且经过很多工程师对代码进行改动开发,导致日志记录缺乏规范化管理,日志格式种类繁多、不统一,个别业务系统记录了多种时间戳格式(甚至有些业务系统并未打印年月日信息)
需求和痛点
海量的错误日志信息
财务公司业务系统中存在海量的错误日志信息,无法通过人为从中筛选重要的错误日志信息,而且日志定期打包处理,导致相关负责人员通过日志处理问题效率低下。
重复交易问题难以发现
财务公司之前遇到了几种交易重复的问题,比如网银端重复指令、财司端重复指令等。这种重复问题并没有明确的系统报错,所以很不容易被人们发现,给业务系统带来了很大的安全管理风险。
分析内容
业务系统错误信息分析
使用日志易之后,将财务公司业务系统日志进行接入,并且将不同的业务系统以不同的appName和tag进行分类,将业务人员提供的错误日志信息进行提取,通过多重筛选之后将各类业务系统最值得关注的日志信息进行次数、趋势、详情等多个图表进行展示。
业务系统耗时分析
在部署和使用日志易之前,财务公司各个业务统计的耗时均为数据库自动计算生成的时间,被技术人员反映该时间缺乏准确性。我们在分析日志过程中,通过搜索交易的开始及结束字段对业务唯一标识进行关联查询,就可区分每一笔业务的开始及结束时间,从而计算出每一笔交易产生的实际耗时。根据耗时分析,我们可以计算出每一笔交易的最大耗时,最小耗时以及平均耗时并将耗时较高的业务排名与历史同期的趋势等进行分析。
中间件分析
针对WAS日志及Zookeeper日志进行了性能分析,例如WAS日志接入并展开分析,通过对GC(垃圾收集器)的日志进行字段解析能够分析出GC的耗时、GC回收之前空闲内存占比等。通过这些字段可以生成趋势图,统计出一天内垃圾回收的次数,以及每天GC的平均耗时、最大耗时、最小耗时,通过对WAS耗时分析可以帮助运维人员分析GC进行垃圾回收时,哪些时段的耗时超出了平均耗时,从侧面反映了系统进行垃圾回收的性能。
重复交易问题解决方案
针对重复交易这一系列重大安全管理风险事件,我们花费了大量时间去研究分析这类日志,将发生重复的这一笔业务和多笔正常业务进行多角度对比,根据得到的相同点和不同点总结出这种重复问题发生时日志的规律性。通过SPL语句准确的定位到发生重复指令时出现的单号,系统可以在重复问题再次出现时第一时间进行告警通知。
服务器性能分析
通过接入业务系统所在服务器的操作系统性能日志进行实时监控,能够分析核心业务系统服务器的CPU、内存、磁盘使用率、磁盘IO使用率、进程占用CPU情况、网卡流量等分析指标,通过对操作系统性能日志进行分析,可以监控当交易高峰期时,根据核心业务系统所承载的压力,查找产生高负荷的资源使用的主机,对主机操作系统性能的使用情况进行关注,并可通过配置监控策略进行告警。
该场景解决的问题
提升了监控告警能力
系统性能监控告警
将客户所关注的系统性能、中间件性能数据定义阈值,配置字段统计告警,当系统性能达到阈值时进行短信告警。
错误事件数告警
根据配置关键字搜索条件,配置事件数告警,当核心业务系统触发告警条件时进行短信告警。
重复交易指令告警
根据财司端业务系统重复可疑指令日志的分析结果,配置为事件数告警,当再次发生重复可疑指令的日志结果时,将以短信形式告警。
分析性能得到提升
该部分输入介绍: 1.class=preview-solve-the-problem-card-right-text-row-icon-title-row的为内容组件, 2.可以通过修改style部分的font-size或font-weight来调整文字样式 3.1rem对应100px,左侧卡片对应的font-size分别为0.22rem 0.18rem,font-weight分别为500, 400
优化各个图标的SPL语句,搜索过慢的使用定时任务,采集定时任务的结果再进行分析,使得搜索速率更加迅速。
案例来源
北京朗维计算机应用技术开发有限公司
北京朗维计算机应用技术开发有限公司成立于1998年11月,注册资金5000万元,是一家专门从事网络安全、基础架构、系统应用、业务增值等系列IT集成与服务的高新技术企业。北京朗维计算机应用技术开发有……
想了解更详细的内容
点击咨询