前文链接:https://blog.csdn.net/heian_99/article/details/119874180
需求:prometheus监控多台主机时,基于自动发现consul模块,主机安装采集器注册到那台consul,consul识别到。promethues获取consul地址上的监控主机列表,实现多台主机自动发现。
思路:
- web机器安装node_exporter采集器
2.注册node_exporter为系统服务
3.使用curl -x PUT … 注册到consul机器中
4.consul监控到后,prometheus配置consul地址。
1-3步都可用ansible批量完成。
node_exoporter软件包 ,system服务配置文件,注册脚本,注册接口
如果有密码验证还需要一个config.yml
consul-register.sh
注册脚本(传参方式注册):
1
2
3
4
5
6
7
|
#!/bin/bash
service_name=$1
instance_id=$2
ip=$3
port=$4
curl -X PUT -d '{"id": "'"$instance_id"'","name": "'"$service_name"'","address": "'"$ip"'","port": '"$port"',"tags": ["'"$service_name"'"],"checks": [{"http": "http://'"$ip"':'"$port"'","interval": "5s"}]}' http://10.10.10.27:8500/v1/agent/service/register
|
node_exporter.service
node_exporter系统服务配置文件
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
|
[heian@zabbix ~]$ cat node_exporter.service
[Unit]
Description=node_exporter
After=network.target
[Service]
ExecStart=/usr/local/node_exporter/node_exporter\
--web.listen-address=:9100\
--collector.systemd\
--collector.systemd.unit-whitelist=(sshd|nginx).service\
--collector.processes\
--collector.tcpstat\
--collector.supervisord
[Install]
WantedBy=multi-user.target
--collector.systemd --collector.systemd.unit-include=(docker|portal|sshd).service 配置的意思是只收集docker,portal,sshd服务的数据
--web.config=/usr/local/jiankong/node_exporter/config.yml 如果有密码验证接口需要指定这个config.yml,里面保存的用户名和密码。需要把这条配在启动execstart行的node_proter后。
|
ansible-playbook
1
2
3
4
|
cat hosts
[blog]
10.10.10.15 name=nginx
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
|
cat playbook.yml
- hosts: blog
remote_user: heian
become: yes
become_user: root
become_method: sudo
gather_facts: no
tasks:
- name: 推送采集器安装包
unarchive: src=node_exporter-1.2.2.linux-amd64.tar.gz dest=/usr/local/
- name: 重命名
shell: |
cd /usr/local/
if [ ! -d node_exporter ];then
mv node_exporter-1.2.2.linux-amd64 node_exporter
fi
- name: 推送system文件
copy: src=node_exporter.service dest=/usr/lib/systemd/system
- name: 启动服务
systemd: name=node_exporter state=started enabled=yes
- name: 推送注册脚本
copy: src=consul-register.sh dest=/usr/local/node_exporter
- name: 注册当前节点
shell: /bin/sh /usr/local/node_exporter/consul-register.sh {{ group_names[0] }} {{ name }} {{ inventory_hostname }} 9100
|
{{ group_names[0] }} –ansible内置变量 代表hosts中自定义组名,数组形式,[0]取第一个
{{ name }} – hosts文件中定义主机的名字,如name=web1
{{ inventory_hostname }} 当前执行主机的ip
执行:
看一下consul中,服务已经注册进来了
prometheus自动发现
参考文档地址:https://www.jianshu.com/p/f243a3aec18e