监控系统的选型建议,这是一款灵活( 五 )


1、先明确清楚你的监控需求:要监控的对象有哪些?机器数量和监控指标有多少?需要具备什么样的告警功能?
2、监控是一项长期建设的事情 , 一开始就想做一个 All In One 的监控解决方案 , 我觉得没有必要 。 从成本角度考虑 , 在初期直接使用开源的监控方案即可 , 先解决有无问题 。
3、从成熟度上看 , Zabbix属于老牌的监控 , 资料多 , 功能全面且稳定 , 如果机器数量在几百台以内 , 不用太担心性能问题 , 另外 , 采用数据库分区、SSD硬盘、Proxy架构、Push采集模式都可以提高监控性能 。
4、Zabbix在监控方面占绝对优势 , 可以满足90%以上的监控场景 , 但是应用层的监控似乎并不擅长 , 比如要监控线程池的状态、某个内部接口的执行时间等 , 这种通常都要做侵入式埋点 。 相反 , 新一代的监控Open-Falcon和Prometheus在这一点做得很好 。
5、从整体表现上来看 , 新一代监控也有明显的优势 , 比如:灵活的数据模型、更成熟的时序数据库、强大的告警功能 , 如果之前对zabbix这种传统监控没有技术积累 , 建议使用Open-Falcon或者Prometheus.
7、Zabbix、Open-Falcon和Prometheus都支持和Grafana做快速集成 , 想要美观且强大的可视化体验 , 可以和Grafana进行组合 。
8、用合适的监控解决相应的问题即可 , 可以多套监控同时使用 , 这种在企业初期很常见 。
9、到中后期 , 随着机器数据增加和个性化需求增多(比如希望统一监控平台、打通公司的CMDB和组织架构关系)往往需要二次或者通过监控的API做集成 , 从这点来看 , Open-Falcon或者Prometheus更合适 。
10、如果非要自研 , 可以多研究下主流监控的架构方案 , 借鉴它们的优势 。
最后的话
本文对监控体系的基础知识、原理和主流架构做了详细梳理 , 希望有助于大家对监控的认识 , 以及在技术选型时做出更合适的选择 。
监控系统的选型建议,这是一款灵活
文章图片
由于篇幅问题 , 本文的内容并未涉及到全链路监控、日志监控、以及Web前端和客户端的监控 , 可见监控真的是一个庞大且复杂的体系 , 如果想理解透彻 , 必须理论结合实践再做深入 。
本文相关词条概念解析:
选型
选型 , 词语 , 指根据实际业务管理的需要 , 对硬件、软件进行规格选择的意思 。
告警
【监控系统的选型建议,这是一款灵活】告警 , 报告发生紧急情况 , 请求加强戒备或援助:~电话 。


推荐阅读