gRPC健康检查协议
健康检查用于检测服务端能否正常处理rpc请求,客户端对服务端的健康检查可以点对点进行,也可以通过某些控制系统(如负载平衡)进行。客户端可以根据服务端返回的状态执行对应的策略。
因为GRPC服务可以用于简单的客户端到服务端场景和其他控制系统(如负载平衡)的健康检查,所以gRPC健康检查协议借助了gRPC服务来实现。使用GRPC服务来实现健康检查有以下好处:
- 执行健康检查的格式与普通rpc相同,
- 具有丰富的语义,例如每个服务的健康状态,
- 能够重用所有现有的计费、配额基础设施等,因此服务器可以完全控制健康检查服务的访问。
gRPC健康检查服务定义
因为gRPC健康检查协议是通过gRPC服务实现的,我们首先看下这个服务的定义:
客户端可以通过调用Check方法(需要设置截止时)查询服务器的运行状况,客户端可以通过设置服务名称来检查对应服务的健康状况。服务名称的格式建议为package_names.ServiceName,例如grpc.health.v1.Health。
服务端要注册所有服务并设置各个服务的状态,包括空服务名称及其状态。对于接收到的每个请求,如果在配置列表中找到了对应服务,需要根据当前服务情况返回SERVING或NOT_SERVING的状态。如果在配置列表没找到对应服务,则返回NOT_FOUND状态。
服务端应使用空字符串作为整体健康状态的键,以便对特定服务不感兴趣的客户端可以通过空请求查询服务的状态。服务端可以只对服务名称进行精确匹配也可以实现更复杂的匹配方式。
如果一次rpc调用在一段时间后都没有收到响应,可以认为服务端挂了,需要执行应对服务端挂掉情况的策略。
客户端可以调用Watch方法来使用基于stream方式的健康检查。服务器会立即发回一条代表当前服务状态的消息。只要服务的状态发生变化,就会发送一条新消息。