随着近几年分布式、微服务架构的火热,RPC在开发工作中使用的越来越多,也变的越来越重要。
今天我们来看RPC是什么,为什么要了解RPC,通过学习RPC我们能掌握什么内容?
什么是「RPC」
RPC 全称 Remote Procedure Call, wikipedia的部分说明:
RPC is a request–response protocol. An RPC is initiated by the client , which sends a request message to a known remote server to execute a specified procedure with supplied parameters. The remote server sends a response to the client, and the application continues its process. |
首先这里的重点是「protocol」,其次是 RPC中的R -「Remote」。所以这里的RPC的意义是一个调用执行远程方法的协议。我们对于方法的调用一般类似这样
- Echo echo = child.say("Hello World");
这种一般是指调用自己本地的方法,比如 Java 应用是指调用在同一个 JVM 内的方法。
如果上述的代码要换成我们以RPC的形式去调用,写法有什么区别呢?
其实是没有的。
我们在调用时仍然按这个形式,仅需要在配置中指定这个方法对应的「远程地址」即可。
再举个生活化的例子。
假设你是招揽游客的小贩。每次集齐了游客你都在卖力的吆喝,在各种神奇的网站的搜索,找对应景点的导游。后来有一天,你和街边多个打印店谈了合作。符合条件可以导对应景点的都可以在打印店「登记」,你下次来的时候根据记录,直接「联系」对应的人即可,省力不少哇。
这里我们看到两种RPC的使用形式:
- 直接在配置中固定写好远程方法的地址,请求是一步到位
- 在配置中提供的「注册处」的地址,方法请求时先到注册处查方法地址再执行
看到这里,你不禁要说,调用个远程方法嘛,又不难,有啥看的。
那我们继续这个生活化的例子。
在你集齐了游客联系经常合作的导游时,他生病了。你要找谁? 你说我有「备份」嘛,登记处记录了好多呢。
那好,这好多个导游里,你「选哪一个」?
你说,靠,我那管那么多,随便挑一个打电话就是了。好,这时你就已经在用到了RPC中的「负载均衡LoadBalance」了,只不过你的策略是用的「随机」。
如果在导游登记的时候每个提供了照片和历史认证评级,那你可能不会随便挑一个打,可能会看看照片,哪个感觉更靠谱,哪个评级更高。此时这些项都做为你联系他的一个「权重」。在多个导游间,这个权重决定了被联系次数的多少。此时你的LB不再是简单随机,而是根据「权重」进行。
再比如你们合作多次,固定的几个景点就是固定的几个导游,老相识,每次带人来都找他。此时你的策略又变成了「一致性Hash」。
后来,有导游和你说,最近像他们这类自找生意的导游,被发现在主动拉生意,可能会罚款,下次联系他的时候别说那么多。于是你们订了个简单「协议」:先说「0或1」,代表是否空闲,再说「1到100」代表你们所带游客游览的景点。再说「0或1」代表是否可以带购物。
你会发现,此时你们的协议里有「编码」,有压缩,每个人在听到对方信息时,需要再在你这里解码,还原成真实的信息。在 RPC 里也一样,在方法调用前,需要将对应的参数序列化,以指定的「格式」传递,到达后再对应的还原回去执行方法。
过了一段时间,你的业务发展壮大,一个景区附近的导游们自动组队。在你请求到达时,这个景区的导游里自动根据上面的权重选一个人出来,这些导游组成的,就是一个「Cluster」
业务发展的同时,你成立了一个秘书团,这些人负责过一段时间联系一下各个导游组,判断这个景区是否能提供,这个时候,秘书团就在进行「监控」。
(一口老血,编不下去了……)
接下来要说的是,我们为什么要学习 RPC。
为什么要学习 RPC
为什么要学习 RPC呢? 我们开头时也提到,微服务、分布式应用的开发越来越常见, RPC 是其中相当重要的组件。通过 RPC 的学习,可以更好的理解和进行较大型应用的设计与开发。
同时, RPC 中涉及到的各类技术,也会使学习者知识面更宽广,每个方面,都值得深入。而对于技术,特别是源码的学习,又会返过来促使更好的理解 RPC,你写出更好的代码。
学习 RPC 我们能掌握什么
我们上面的生活化例子中,提到了这些技术
- 注册处
- 集群
- 负载均衡
- 协议
- 序列化编码、解码
- 一致性Hash
- 监控
- ……
这些技术,也是 RPC 中很重要的一些内容。 我们看 Dubbo 的源码中,从代码的组织上,也能一窥究竟。
这张图里,比我们在上面例子里提到的技术,多一些「Filter」,「Config」还有「Remoting」,包含了更完整的 RPC 的配置管理,请求过滤,多协议支持等内容。
而对 RPC 学习,例如负载均衡,除技术之外,还可以学习一种思想,是一种可迁移的东西。这种负载均衡的使用和实现,在 Nginx、Apache 做反向代理,在 应用服务器做集群搭建时,都会用的到。
像一致性Hash,对于通过 Hash思想来实现请求均衡的实现中,一致性 Hash 的思路,能更大程度的保证请求 Hash到原来的服务器上,在增减服务器时,影响减小。
再比如「注册处」Registry 中,我们可以了解到通过 zk, redis,甚至广播 的注册处实现。这种注册处的学习,可以在我们后续的微服务,分布式应用中常用的「注册中心」提供实现的思路。
再比如 我们远程调用时参数、信息的序列化,我们 Java 默认的序列化在性能上不能满足 RPC 这种高频序列化的应用场景,那有什么好的办法来提升序列化性能呢?
你会发现 Dubbo 中集成了 kryo,hessian2,fastjson等支持,可以比较学习这些不同的序列化实现,在自己的业务场景中有需要时,就发现你的技能工具箱中又多了一件工具。
类似的内容还有很多,学习这些都能让我们更好的成长。
【本文为51CTO专栏作者“侯树成”的原创稿件,转载请通过作者微信公众号『Tomcat那些事儿』获取授权】