6.监控分析

此层为容器平台上监控与分心相关的部分,主要分为等监控、日志、服务链追踪与混沌工程等四个方面进行展开。这一层主要是聚集了与监控与分心相关的通用的架构、工具以提供相关能力。结合CNCF孵化项目,可以考虑使用 Prometheus 做相关的监控告警服务,使用 fluentd 进行日志管理,使用 JAEGER 或 OPENTRACING 进行服务调用链分析。

而在实际的项目,已经毕业的 Prometheus 确实是一个不错的选择项,但是由于监控是传统运维的重要作业,所以在存量的解决方案中已经有很多实际使用的方式,在这些方案中,使用 graphite 或者 influxdata 提供时序列数据存储功能,使用 Grafana 进行展示的项目不在少数,结合 ZABBIX 和 Nagios 进行监控的项目也有不少。

而进行日志的管理,显然 ElasticSearch 和 Logstash 的 ELK 或者 EFK 是很多用户的选择,除此之外,商业的版本使用 splunk 的用不也不在少数。

而关于服务链路跟踪,显然使用 Dapper 论文原理实现的 ZIPKIN 和 PINPOINT 得到的实践最多,而在 SpringCloud 的解决方案中,Spring Cloud Sleuth 作为调用链的解决方案,随着 Spring Cloud 的使用也得到了很多地关注,成为 Spring Cloud 下理所应当的服务调用链解决方案。

可观察性与分析

为了限制服务中断并降低MRRT(解决问题的时间),您需要监视和分析应用程序的各个方面,以便立即发现并纠正任何异常情况。故障将在复杂的环境中发生,这些工具将通过帮助尽快识别和解决故障来帮助减轻影响。由于此类别遍历并监视所有层,因此它在侧面,而不是嵌入在特定层中。

在这里您会发现:

(1)收集事件日志(有关进程的信息)的日志记录工具。

(2)监视解决方案与收集指标(数字系统参数,例如RAM可用性)。

(3)跟踪比监视和监视用户请求的传播更进一步。这与服务网格相关。

(4)混沌工程是对生产中的软件进行测试的工具,可以在缺陷影响服务交付之前对其进行识别并加以修复。

Copyright © 温玉 2021 | 浙ICP备2020032454号 all right reserved,powered by Gitbook该文件修订时间: 2021-05-11 15:05:52

results matching ""

    No results matching ""