Ceph 监控中应用 Prometheus relabel 功能

  • 时间:
  • 浏览:3

如下图所示加在 clusters variable,最后保存。

不过 fsid 这个变量很难直观看出来代表的是哪个 Ceph 集群,也都有都没有 好的方案。

接下来每个图表的查询句子也要做对应的修改:

具体的配置如下,cluster label 的值就改为了 ceph*,否则 导出到了新 label clusters 中。

最后多亏 neurodrone,才了解到 Prometheus 的 relabel 功能,可需要完美的除理这个难题。

我最现在现在开始 英语 想到的除理法律方法是修改 ceph_exporter,既然 cluster name 不行,那加在 Ceph 的 fsid 总能区分出来了吧,就像另都没有 :

你说有人会说,那就改 Ceph cluster name 不就好了。难题是 Ceph 修改 Cluster name 没都没有 简单,ceph 文件存储目录都有和 Cluster name 有对应关系的,什么都有什么都有配置文件和数据都需要修改目录还都可不可以生效,对于因为现在现在开始 英语 正式使用的 Ceph 集群,都没有 做风险一阵一阵大。当然因为给每个 Ceph 集群单独搭建都没有 Prometheus 和 Grafana 环境句子,难题还都可不可以除理,但这个法律方法显得太没技术含量了,还都可不可以 万不得已,其实我想要采用。

举都没有 例子,都没有 集群的 ceph_pool_write_total 的 label cluster 取值都为 ceph。但在 Prometheus 的配置中,有人分别是分属于不通 job 的,有人可需要通过对 job 进行 relabel 来修改 cluster label 的指,来完成区分。

工作环境含有都没有 独立的 Ceph 集群,分别负责对象存储、块存储和文件存储。搭建这十2个 Ceph 集群时,我对 Ceph 重命名 Cluster name 的难度都没有 足够的了解,什么都有使用的都有默认的 cluster name:ceph,不巧的是 Prometheus 的 ceph_exporter 否则 用 cluster name 来区分不同集群,结果是 Grafana 中各个集群的数据无法区分,所有的集群数据都绘制在了都没有 图标中,非常乱不说,否则 每项数据还无法正常显示。

最终改好的 dashboard json 文件可从如下链接下载到:

ceph-cluster.json

修改后的 metric 信息变成这个样子,另都没有 有人就可需要区分出不同的 Ceph 集群的数据了。

光是修改 Prometheus 的配置还过高 ,毕竟有人需要在界面可需要体现出来,Grafana 的 dashboard 也要做对应的修改,本文使用的 dashboard 是 Ceph - Cluster

Relabel 的本意其实修改导出 metrics 信息的 label 字段,可需要对 metrics 做过滤,删除这个并里还都可不可以 的 metrics,label 重命名等,否则 也支持对 label 的值作出修改。

有人因为可需要在 dashboard 上看得人新加的 variable 了:

首先是要 dashboard 加在 clusters 变量,在界面上操作即可。

先点击 dashboard 的 "settings" 按钮(显示齿轮图标的否则 )