基于grafana的监控大屏展示
基于grafana的监控大屏展示
zabbix可以很好的完成监控与告警处理,但对于更美观的展示,还是grafana更擅长,本文讨论如何利用grafana的 status panel 插件做监控大屏的展示。
1 整体设计
如下图
即根据环境纵向分布,每个环境下又包括web状态、Openstack服务状态,操作系统状态,基础设施状态。
分类 | 包含内容 | 备注 |
---|---|---|
web探测状态 | 需要监控的web页面 | |
openstack服务状态 | 包括nova,cinder,pcs服务异常等 | |
操作系统状态 | 包括磁盘不足、内存等不足 | |
基础设施 | 包括ceph监控状态,ping不通等信号 |
即展示的状态为合成信号,当任一信号出现异常时,panel的颜色能够变成黄色或者更严重的红色。
2 grafana配置说明
这种展示效果依赖于grafana插件 Status Panel ,需要先行安装。
添加组件时,选择 Status Panel ,然后选择对应的信号
Metrics配置中,Group,Host,Application,Item 为zabbix中对应的监控项目,下面的Functions为给该项目的展示取个别名。
Options配置中,Alias为更改的别名,Warn为告警变成黄色的时候的取值,Critical为告警变成红色时的取值。
3 Warn/Critical配置列表说明
配置效果 | Warn | Critical |
---|---|---|
绿色状态为0,黄色状态为2 | 2 | 3 |
绿色状态为0,红色状态为2 | 1 | 2 |
绿色状态为0,黄色状态为2,红色状态为4 | 2 | 4 |
绿色状态为1,红色状态为0 | 0.9 | 0.8 |
绿色状态为1,黄色状态为0 | 0 | -1 |
绿色状态为>80,黄色状态为<80 | 80 | 0 |
也就是说根据显示的内容,Warn和Critical的配置需要存在递增和递减的关系,配置时,需要额外注意。
4 信号合并说明
Status Panel 中当任何配置项目发生异常时,均会改变颜色,但当配置项目过多时,配置本身的工作量很大,建议在源头进行信号的合并,这样可以显著的减少grafana的配置工作量。
如上面我们展示的openstack服务状态,我们有80个计算节点,对应的status和state信号一共有160个,如果一个个配置工作量是很大的,我们可以在zabbix中额外增加2个信号,即status合并信号和state合并信号,这样在grafana中仅仅需要配置2个信号即可。