详情页标题前

腾讯云对象存储基于 Prometheus 搭建 GooseFS 监控体系

详情页1

Goosefs 可以通过配置将指标数据输出到不同的监控系统中,Prometheus 是其中之一。Prometheus 是一个开源的监控框架,目前腾讯云可观测平台已集成了 Prometheus,下文将重点介绍 Goosefs 监控指标,以及将监控指标上报到自建的 Prometheus 和云上 Prometheus 的流程。

准备工作

通过 Prometheus 构建监控体系需要先做如下准备工作:配置 GooseFS 集群下载 Prometheus 官方安装包或腾讯云 Prometheus 安装包下载和配置 Grafana

启用 GooseFS 监控指标上报配置

1. 编辑 GooseFs 配置 conf/goosefs-site.properties, 添加如下配置项,并使用 goosefs copyDir conf/ 拷贝到所有 worker节点,并重启集群 ./bin/goosefs-start.sh all

goosefs.user.metrics.collection.enabled=truegoosefs.user.metrics.heartbeat.interval=10s

2. master 和 worker 的 Prometheus 的监控指标可用如下的命令查看,其中 master 的 metrics 端口为9201,worker 的 metrics 端口为 9204:

curl :/metrics/prometheus/# HELP Master_CreateFileOps Generated from Dropwizard metric import (metric=Master.CreateFileOps, type=com.codahale.metrics.Counter)...
curl :/metrics/prometheus/# HELP pools_Code_Cache_max Generated from Dropwizard metric import (metric=pools.Code-Cache.max, type=com.codahale.metrics.jvm.MemoryUsageGaugeSet$$Lambda$51/137460818)...

上报监控指标到自建 Prometheus

1. 下载 Prometheus 安装包并解压,修改 prometheus.yml:

# prometheus.ymlglobal: scrape_interval:     10s evaluation_interval: 10sscrape_configs: - job_name: 'goosefs masters'     metrics_path: /metrics/prometheus     file_sd_configs:     - refresh_interval: 1m     files:     - "targets/cluster/masters/*.yml" - job_name: 'goosefs workers'     metrics_path: /metrics/prometheus     file_sd_configs:     - refresh_interval: 1m     files:     - "targets/cluster/workers/*.yml"

2. 创建 targets/cluster/masters/masters.yml,添加 master 的 IP 和 port:

- targets:  - "<TARGERTS_MASTER_IP>:<TARGERTS_MASTER_PORT>"

3. 创建 targets/cluster/workers/workers.yml,添加 worker 的 IP 和 port:

- targets:  - "<TARGERTS_WORKER_IP>:<TARGERTS_WORKER_PORT>"

4. 启动 Prometheus,其中 –web.listen-address 指定 Prometheus 监听地址,默认端口号 9090:

nohup ./prometheus --config.file=prometheus.yml --web.listen-address=":" > prometheus.log 2>&1 &

5. 查看可视化界面:

http://:

6. 查看机器实例:

http://:/targets

上报监控指标到腾讯云 Prometheus

1. 按照安装指南中的指引,在 master 机器上安装 Promethus agent:

wget https://rig-1258344699.cos.ap-guangzhou.myqcloud.com/prometheus-agent/agent_install && chmod +x agent_install && ./agent_install prom-12kqy0mw agent-grt164ii ap-guangzhou  

2. 配置 master 和 worker 的抓取任务:方式一:

job_name: goosefs-mastershonor_timestamps: truemetrics_path: /metrics/prometheusscheme: httpfile_sd_configs:- files:  - /usr/local/services/prometheus/targets/cluster/masters/*.yml  refresh_interval: 1mjob_name: goosefs-workershonor_timestamps: truemetrics_path: /metrics/prometheusscheme: httpfile_sd_configs: - files:  - /usr/local/services/prometheus/targets/cluster/workers/*.yml  refresh_interval: 1m

注意 job_name 中没有空格,而单机的 Prometheus 的 job_name 中可以包含空格。方式二:

job_name: goosefs mastershonor_timestamps: truemetrics_path: /metrics/prometheusscheme: httpstatic_configs:- targets: - ":" refresh_interval: 1m
job_name: goosefs workershonor_timestamps: truemetrics_path: /metrics/prometheusscheme: httpstatic_configs:- targets: - ":" refresh_interval: 1m

注意 抓取任务按方式二配置,则无需在 targets/cluster/masters/ 路径下创建 masters.yml 和 workers.yml 文件。

使用 Grafana 查看监控指标

1. 启动 Grafana:

nohup ./bin/grafana-server web > grafana.log 2>&1 &

2. 打开登录页面 http://:,Grafana 的默认端口为 3000,username 和 password 都是 admin,首次登录后可修改密码。3. 进入页面后,添加 Prometheus 的 Datasource:

:

4. 导入 Goosefs 的 Grafana 模板,选择 json 导入(点此下载 json),并选择上面创建的 Datasource。注意 云上 Prometheus 购买时需设置密码,云上 Grafana 的可视化监控界面配置和上面类似,注意 job_name 需要配置成一致。5. 修改 DashBoard 以后,可以将 DashBoard 导出来。
对象存储官网1折活动,限时活动,即将结束,速速收藏
同尘科技为腾讯云授权服务中心。
购买腾讯云产品享受折上折,更有现金返利。同意关联立享优惠

转转请注明出处:https://www.yunxiaoer.com/144888.html

(0)
上一篇 2023年12月9日
下一篇 2023年12月9日
详情页2

相关推荐

  • 阿里云RDS数据库使用流程-云淘科技

    快速入门旨在介绍如何创建RDS MySQL实例、进行基本设置以及连接实例,使用户能够了解从购买RDS实例到开始使用实例的流程。 若您初次使用阿里云RDS,请先了解阿里云RDS使用限制。 快速入门视频指导 简易流程通常,从新购实例到可以开始使用实例,您需要完成如下操作。 快速创建RDS MySQL实例 创建数据库和账号 通过DMS登录RDS MySQL 更多操…

    阿里云数据库 2023年12月9日
  • 阿里云RDS数据库创建Babelfish for RDS PostgreSQL实例-云淘科技

    本文介绍如何创建Babelfish for RDS PostgreSQL实例。 注意事项 当前仅支持在购买实例时开通Babelfish,且实例需满足以下条件: 实例大版本:RDS PostgreSQL 13、14或15。 实例产品类型为标准版。 已购买的RDS PostgreSQL实例,暂不支持开通Babelfish。 开通Babelfish后,暂不支持关闭…

    2023年12月9日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 腾讯云云直播直播码接入

    接入配置 在云直播控制台中选择直播码接入进入直播码接入页面,选择接入配置设置对应的回调 URL 地址,即可接入直播码,还可开启直播录制。新版控制台提供更全面更便捷的直播功能,可参考 切换新版控制台 进行切换。注意仅直播旧版控制台用户有直播码接入模式,不支持切换频道模式,频道模式后续将下线并暂停使用。若您为新版控制台用户,将无直播码接入模式,请使用域名管理和流…

    2023年12月9日
  • 腾讯云容器服务GPU 监控指标获取同尘科技

    组件介绍 TKE 开发了 elastic-gpu-exporter 组件用于获取 GPU 相关监控指标,主要包含:GPU 卡利用率Pod / 容器 GPU 资源利用率 部署方式 elastic-gpu-exporter 通过 DaemonSet 的方式部署到集群里。 apiVersion: apps/v1kind: DaemonSetmetadata: na…

    腾讯云 2023年12月9日
  • 腾讯云内容分发网络CDN回源 SNI

    配置场景 若您的源站 IP 绑定了多个域名,当 CDN 节点以 HTTPS 协议访问源站时,您可以设置回源 SNI,指明具体的访问域名。 配置指南 查看配置 默认情况下,回源 SNI 为关闭状态,您可按照实际需要自主开启。  编辑配置 开启后,需要设置回源 SNI,配置具体的访问域名。也可以再关闭配置开关,开关为关闭状态时,即使下方存在具体的配置,仍不会现…

    2023年12月9日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。