Featured image of post Prometheus报警规则别名设置

Prometheus报警规则别名设置

报警规则,是由语句编写组合的,但是有时语句会很长,我们看还好,但是有时间业务组那边也会使用来看主机偏高的指标,这边只能设置别名,方便他们使用。别名设置:很简单,也是和报警规则一样,但是语法可能不一样示。。。。。。。

Featured image of post Prometheus监控,生产可用告警规则(可获取主机名)

Prometheus监控,生产可用告警规则(可获取主机名)

以下是生产环境中告警规则用例默认的是格式的,无法知道主机名。方法一:获取参考链接:主机名在指标中,且的值恰巧为,所以我们可以在中通过提取,只需要在原有后添加这样,在告警的中,就可以通过获取主机名了特别。。。。。。。

Featured image of post Ansible批量部署客户端并注册consul自动发现

Ansible批量部署客户端并注册consul自动发现

前文链接:需求:监控多台主机时,基于自动发现模块,主机安装采集器注册到那台,识别到。获取地址上的监控主机列表,实现多台主机自动发现。思路:机器安装采集器注册为系统服务使用注册到机器中监控到后,配置地址。。。。。。。

Featured image of post Prometheus基于consul中心自动发现注册监控

Prometheus基于consul中心自动发现注册监控

一、简介配置文件里配置需要监听的服务时,是按服务名写死的,如果后面增加了节点或者组件信息,就得手动修改此配置,并重启;那么能否动态的监听微服务呢?提供了多种动态服务发现的功能,这里以为例。二、引入的好。。。。。。。

Featured image of post Zabbix监控流量异常(偶尔超出交换机限制)

Zabbix监控流量异常(偶尔超出交换机限制)

前提:近期业务做了集群的流量汇总,整体没有问题。后面慢慢优化一些参数项。但是这两天发现,集群流量数据增大,业务正常。问题:和监控网卡,流量异常增大,超出限制,每次分钟,偶尔性触发看图,这个和月对比,简。。。。。。。