运行一个协调器意味着保持节点在线,正确处理任务,每轮调用奖励,并赎回票证。监控有助于您在收入或声誉受损之前发现故障。
内置指标
使用-monitor=true, go-livepeer 在以下位置提供与 Prometheus 兼容的指标:
http://localhost:7935/metrics
要跟踪的内容
| 层 | 要监控的内容 |
|---|
| 硬件 | GPU 使用率、VRAM、温度 (nvidia-smi) |
| 应用 | go-livepeer 健康状态、分段/任务成功率 |
| 网络 | 延迟,丢包 |
| 链上 | 质押余额,活跃集状态,奖励调用 |
| 经济 | ETH 费用,LPT 奖励 |
关键指标包括:livepeer_segment_processed_total, livepeer_segment_errors_total, livepeer_transcode_latency_seconds, 以及(对于AI)推理任务数量和延迟。高错误率会降低选择概率。
If you do not call reward() every round, you stop earning inflation rewards. Automate reward calls or use a service that does.
浏览器
使用 Livepeer Explorer to check:
- Active set status
- Bonded and delegated LPT
- Reward calls and fee earnings
- Historical performance
Prometheus 和 Grafana
对于生产环境,使用您的节点的抓取配置运行 Prometheus,并使用或构建 Grafana 仪表板。添加 “节点导出器 和 NVIDIA DCGM 导出器 以获取主机和 GPU 指标。
另请参阅