基于grafana的监控大屏展示

基于grafana的监控大屏展示

zabbix可以很好的完成监控与告警处理,但对于更美观的展示,还是grafana更擅长,本文讨论如何利用grafana的 status panel 插件做监控大屏的展示。

1 整体设计

如下图

avatar

即根据环境纵向分布,每个环境下又包括web状态、Openstack服务状态,操作系统状态,基础设施状态。

分类 包含内容 备注
web探测状态 需要监控的web页面  
openstack服务状态 包括nova,cinder,pcs服务异常等  
操作系统状态 包括磁盘不足、内存等不足  
基础设施 包括ceph监控状态,ping不通等信号  

即展示的状态为合成信号,当任一信号出现异常时,panel的颜色能够变成黄色或者更严重的红色。

2 grafana配置说明

这种展示效果依赖于grafana插件 Status Panel ,需要先行安装。

添加组件时,选择 Status Panel ,然后选择对应的信号

avatar

Metrics配置中,Group,Host,Application,Item 为zabbix中对应的监控项目,下面的Functions为给该项目的展示取个别名。

avatar

Options配置中,Alias为更改的别名,Warn为告警变成黄色的时候的取值,Critical为告警变成红色时的取值。

3 Warn/Critical配置列表说明

配置效果 Warn Critical
绿色状态为0,黄色状态为2 2 3
绿色状态为0,红色状态为2 1 2
绿色状态为0,黄色状态为2,红色状态为4 2 4
绿色状态为1,红色状态为0 0.9 0.8
绿色状态为1,黄色状态为0 0 -1
绿色状态为>80,黄色状态为<80 80 0

也就是说根据显示的内容,Warn和Critical的配置需要存在递增和递减的关系,配置时,需要额外注意。

4 信号合并说明

Status Panel 中当任何配置项目发生异常时,均会改变颜色,但当配置项目过多时,配置本身的工作量很大,建议在源头进行信号的合并,这样可以显著的减少grafana的配置工作量。

如上面我们展示的openstack服务状态,我们有80个计算节点,对应的status和state信号一共有160个,如果一个个配置工作量是很大的,我们可以在zabbix中额外增加2个信号,即status合并信号和state合并信号,这样在grafana中仅仅需要配置2个信号即可。

Table of Contents