扩展当前库以包含额外的指标

GitHub - Strech/sidekiq-prometheus-exporter: All the basic metrics of Sidekiq with pluggable contribs prepared for Prometheus · GitHub 纳入项目中是否有益?例如,我目前缺少该插件提供的已完成和失败任务计数,而这是判断是否存在故障的最重要指标之一。

2 个赞

该项目完全独立,我们不会将其集成。

如果您缺少指标,请提交功能请求以添加,或在 PR 中添加。

不幸的是,Ruby 并非我的专长,因此提交 PR 对我来说似乎是一条坎坷之路。我可以尝试一下,但这对我来说将是一个陡峭的学习曲线。另一方面,上述官方仓库不允许创建工单,因此我能够请求新功能的渠道非常有限,即——这里。

因此,我请求将当前库扩展为包含以下指标。巧合的是,这正是上述库中列出的指标列表。我已经标记了当前版本中已有的指标。加粗的指标似乎是全面监控后台运行 Sidekiq 最显而易见的选择。

指标 类型 描述 已实现的指标
sidekiq_processed_jobs_total counter 已处理作业的总数 discourse_sidekiq_job_count
sidekiq_failed_jobs_total counter 失败作业的总数
sidekiq_workers gauge 所有进程中的工作进程总数 discourse_sidekiq_workers
sidekiq_processes gauge 进程数量 discourse_sidekiq_processes
sidekiq_busy_workers gauge 正在执行作业的工作进程数量
sidekiq_enqueued_jobs gauge 已排队的作业数量 discourse_sidekiq_jobs_enqueued
sidekiq_scheduled_jobs gauge 计划在未来执行的作业数量
sidekiq_retry_jobs gauge 计划进行下一次重试的作业数量
sidekiq_dead_jobs gauge 处于死亡状态的作业数量
sidekiq_queue_latency_seconds gauge 队列中最旧作业被推入队列的时间与当前时间之间的秒数(标签:name)
sidekiq_queue_max_processing_time_seconds gauge 队列中最旧作业开始执行的时间与当前时间之间的秒数(标签:name)
sidekiq_queue_enqueued_jobs gauge 队列中已排队的作业数量(标签:name)

如果我遗漏了某项或误解了某些内容,请指正。

1 个赞