最近由于工作上的安排,我们产品的运维工作也落到了我头上,接手发现很多运维工作方式比较原始,尤其时在监控方面的欠缺,使得我们处于很被动的局面,所以想着搭建一套监控系统;在做监控平台选型时,比来比去决定还是用prometheus来搭建我们的监控平台,基于我们做这个决定的原因主要有如下几点: 社区活跃,很多人都在用 prometheus属于一站式监控告警平台,依赖少,功能齐全。 prometheus支持对云或者容器的监控,其他系统主要对主机的监控。 扩展能力比较好,对于后续我们的服务的自定义监控指标集成比较容易。 下面开始搭建: prometheus :github地址 搭建Prometheus 查