背景
当我们用 K8s + Docker 容器化部署基于 SpringCloud 微服务时,根据实际业务需要,可能会对某些服务采取多节点实例部署,这样可以实现服务的负载均衡及高可用架构。但我们有时为了监控服务的稳定性,除了 K8s 平台提供的控制台监控以外,项目组内部也会针对微服务的稳定性提出监控的需求,来开发自己内部监控的平台,所以需要通过采集服务节点不同时刻的日志数据来分析服务的健康状态,从而实现对服务监控预警的目的。
Eureka 客户端配置
<code>spring:
application:
name: dcp-hellworld-service
eureka:
client:
serviceUrl:
defaultZone: http://dcp-peer-eureka1:8000/eureka/,http://dcp-peer-eureka2:8000/eureka/,http://dcp-peer-eureka3:8000/eureka/
instance:
status-page-url-path: /info
instance-id: ${spring.cloud.client.ipAddress}:${server.port}
preferIpAddress: true
registry-fetch-interval-seconds: 30
lease-renewal-interval-in-seconds: 15
lease-expiration-duration-in-seconds: 15/<code>
eureka.client.serviceUrl.defaultZone 指定的是 Eureka 高可用集群 Server 节点:dcp-peer-eureka1,dcp-peer-eureka2、dcp-peer-eureka3,三节点之间互为主备。
我们在 K8s 平台为微服务 dcp-hellworld-service 配置 10 个实例节点,当 dcp-hellworld-service 服务启动后,这个 10 个节点会同时向 Eureka 注册中心注册,这时我们会在 Eureka 监控页看到这10个注册节点节点实例信息。
为了实现对 dcp-hellworld-service 服务监控,需要获取服务的实例列表,首先,需要在监控程序的 Controller 层引入 DiscoveryClient 服务注册发现类。
<code>@Autowired
private DiscoveryClient discoveryClient;/<code>
其次,通过 DiscoveryClient 获取到 dcp-hellworld-service 服务的 10 个节点信息。
<code>List<ServiceInstance> serviceInstances = discoveryClient.getInstances(serviceId);/<code>
最后, dcp-hellworld-service 定义一个 test 接口,通过调接口的方式检查服务心跳是否运行正常。
<code>@GetMapping("/test")
public String invoke() {
return "invoke::" + UUID.randomUUID();
}/<code>
Actuator 监控模块
当然有些同学可能会说,可以引用 actuator 监控模块,其内部提供了非常丰富的监控指标,当然也是可以的。
<code><dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
<version>2.1.3.RELEASE</version>
</dependency>/<code>
常用的监控指标如下:
1 /health/{component}/{instance} GET
报告程序的健康指标,这些数据由HealthIndicator实现类提供
2 /info GET
获取程序指定发布的信息,这些信息由配置文件中info打头的属性提供
3 /configprops GET
描述配置属性(包含默认值)如何注入到bean
4 /beans GET
描述程序中的bean,及之间的依赖关系
5 /env GET
获取全部环境属性
6 /env/{name} GET
根据名称获取指定的环境属性值
7 /mappings GET
描述全部的URI路径,及和控制器的映射关系
8 /metrics/{requiredMetricName} GET
统计程序的各种度量信息,如内存用量和请求数
9 /httptrace GET
提供基本的http请求跟踪信息,如请求头等
10 /threaddump GET
获取线程活动的快照
11 /conditions GET
提供自动配置报告,记录哪些自动配置通过,哪些没有通过
12 /loggers/{name} GET
查看日志配置信息
13 /auditevents GET
查看系统发布的事件信息
14 /caches/{cache} GET/DELETE
查看系统的缓存管理器,另可根据缓存管理器名称查询;
另DELETE操作可清除缓存
15 /scheduledtasks GET
查看系统发布的定时任务信息
16 /features GET
查看Springcloud全家桶组件信息
17 /refresh POST
重启应用程序,慎用
18 /shutdown POST
关闭应用程序,慎用
接口耗时分析服务健康状态
但是,上面的监控指标针对是服务系统级层面。如果你还有别的一些业务型监控指标需要监控,可能就满足不了,所以需要你单独开发接口实现,例如:定期测试下某个接口的平均调用时长。
下面代码是循获取 dcp-hellworld-service 服务10 个节点信息,调用 api/v1/test 接口,记录接口调用的耗时情况,同时通过消息队列 kafka 发送消息到监控平台进行日志分析。
<code>@GetMapping("/service/{serviceId}/multinstances")
public R testMuitlIntancesInvoke(@PathVariable String serviceId) {
RestTemplate restTemplate = new RestTemplate();
// 获取服务的实例列表
List<ServiceInstance> serviceInstances = discoveryClient.getInstances(serviceId);
if (CollectionUtils.isNotEmpty(serviceInstances)) {
serviceInstances.forEach(s -> {
long s = System.currentTimeMillis();
StringBuilder invokeURL = new StringBuilder();
invokeURL.append("http://").append(s.getHost()).append(":").append(s.getPort());
invokeURL.append("api/v1/test");
String invokeResult = restTemplate.getForObject(invokeURL.toString(), String.class);
long e = System.currentTimeMillis();
// 发送 kafka 消息
kafkaClient.send(topicName, s , (e-s)/1000);
});
}
return R.ok().data(serviceInstances.size());
}/<code>
总结
上面例子是一个简单的通过接口调用统计接口耗时情况来分析服务的健康状态,起一个抛砖引玉的作用吧。
实际上实现服务的监控指标有很多,如数据库的读写、服务器资源、消息队列的积压监控,Nginx等等,需要使用不同的组件来实现,如调用 K8s 原生 API 获取容器的资源使用情况,在这里就不做深入探讨了。
参考
<code>https://www.jianshu.com/p/d59f06724f1b/<code>
后台私信回复 1024 免费领取 SpringCloud、SpringBoot,微信小程序、Java面试等全套视频资料。