React Server Component 从理念到原理

开发 前端
SSG是后端「编译时方案」。使用SSG的业务,后端代码在编译时会生成HTML(通常会被上传CDN)。当前端发起请求后,后端(或CDN)始终会返回编译生成的HTML。

大家好,我卡颂。

React Server Component(后文简称RSC)是React近几年最重要的特性。虽然他对React未来发展至关重要,但由于:

  • 仍属实验特性。
  • 配置比较繁琐,且局限较多。

所以虽然体验Demo[1]已经发布3年了,但仍属于「知道的人多,用过的人少」。

本文会从以下几个角度介绍RSC:

  1. RSC是用来做啥的?
  2. RSC和其他服务端渲染方案(SSR、SSG)的区别
  3. RSC的工作原理

希望读者读完本文后对RSC的应用场景有清晰的认识。

本文参考了how-react-server-components-work[2]

什么是RSC

对于一个React组件,可能包含两种类型的状态:

  • 前端交互用的状态,比如加载按钮的显/隐状态
  • 后端请求回的数据,比如下面代码中的data状态用于保存后端数据:
function App() {
  const [data, update] = useState(null);
  
  useEffect(() => {
    fetch(url).then(res => update(res.json()))
  }, [])
  
  return <Ctn data={data}/>;
}

「前端交互用的状态」放在前端很合适,但「后端请求回的数据」逻辑链路如果放在前端则比较繁琐,整个链路类似如下:

  1. 前端请求并加载React业务逻辑代码。
  2. 应用执行渲染流程。
  3. App组件mount,执行useEffect,请求后端数据。
  4. 后端数据返回,App组件的子组件消费数据。

如果我们根据「状态类型」将组件分类,比如:

  • 「只包含交互相关状态」的组件,叫客户端组件(React Client Component,简写RCC)。
  • 「只从数据源获取数据」的组件,叫服务端组件(React Server Component,简写RSC)。

按照这种逻辑划分,上述代码中:

  • App组件只包含数据,显然属于SSR。
  • App组件的子组件Ctn消费data,如果他内部包含交互逻辑,应该属于RCC。

将上述代码改写为:

function App() {
  // 从数据库获取数据
  const data = getDataFromDB();
  return <Ctn data={data}/>;
}

其中:

  • App组件在后端运行,可以直接从数据源(这里是数据库)获取数据
  • Ctn组件在前端运行,消费数据

改造后「前端交互用的状态」逻辑链路不变,而「后端请求回的数据」逻辑链路却变短很多:

  1. 后端从数据源获取数据,将RSC数据返回给前端。
  2. 前端请求并加载业务逻辑代码(来自步骤0)。
  3. 应用执行渲染流程(此时App组件已经包含数据)。
  4. App组件的子组件消费数据。

这就是RSC的理念,一句话概括就是 —— 根据状态类型,划分组件类型,RCC在前端运行,RSC在后端运行。

与SSR、SSG的区别

同样涉及到前端框架的后端运行,RSC与SSR、SSG有什么区别呢?

首先,SSG是后端「编译时方案」。使用SSG的业务,后端代码在编译时会生成HTML(通常会被上传CDN)。当前端发起请求后,后端(或CDN)始终会返回编译生成的HTML。

RSC与SSR则都是后端「运行时方案」。也就是说,他们都是前端发起请求后,后端对请求的实时响应。根据请求参数不同,可以作出不同响应。

同为后端运行时方案,RSC与SSR的区别主要体现在输出产物:

  • 类似于SSG,SSR的输出产物是HTML,浏览器可以直接解析。
  • RSC会流式输出一种「类JSON」的数据结构,由前端的React相关插件解析。

既然输出产物不同,那么他们的应用场景也是不同的。

比如,在需要考虑SEO(即需要后端直接输出HTML)时,SSR与SSG可以胜任(都是输出HTML),而RSC则不行(流式输出)。

同时,由于实现不同,同一个应用中可以同时存在SSG、SSR以及RSC。

RSC的限制

「RSC规范」是如何区分RSC与RCC的呢?根据规范定义:

  • 带有.server.js(x)后缀的文件导出的是RSC。
  • 带有.client.js(x)后缀的文件导出的是RCC。
  • 没有带server或client后缀的文件导出的是通用组件。

所以,我们上述例子可以导出为2个文件:

// app.server.jsx
function App() {
  // 从数据库获取数据
  const data = getDataFromDB();
  return <Ctn data={data}/>;
}

// ctn.client.jsx
function Ctn({data}) {
  // ...省略逻辑
}

对于任意应用,按照「RSC规范」拆分组件后,能得到类似如下的组件树,其中RSCRCC可能交替出现:

图片

但是需要注意:RCC中是不允许import RSC的。也就是说,如下写法是不支持的:

// ClientCpn.client.jsx

import ServerCpn from './ServerCpn.server'
export default function ClientCpn() {
  return (
    <div>
      <ServerCpn />
    </div>
  )
}

这是因为,如果一个组件是RCC,他运行的环境就是前端,那么他的子孙组件的运行环境也是前端,但RSC是需要在后端运行的。

那么上述RSC和RCC交替出现是如何实现的呢?

图片

答案是:通过children。

改写下ClientCpn.client.jsx:

// ClientCpn.client.jsx

export default function ClientCpn({children}) {
  return (
    <div>{children}</div>
  )
}

在OuterServerCpn.server.jsx中引入ClientCpn与ServerCpn:

// OuterServerCpn.server.jsx
import ClientCpn from './ClientCpn.client'
import ServerCpn from './ServerCpn.server'
export default function OuterServerCpn() {
  return (
    <ClientCpn>
      <ServerCpn />
    </ClientCpn>
  )
}

组件结构如下:

解释下这段代码,首先OuterServerCpn是RSC,则他运行的环境是后端。他引入的ServerCpn组件运行环境也是后端。

ClientCpn组件虽然运行环境在前端,但是等他运行时,他拿到的children props是后端已经执行完逻辑(已经获得数据)的ServerCpn组件。

RSC协议详解

我们可以将RSC看作一种rpc(Remote Procedure Call,远程过程调用)协议的实现。数据传输的两端分别是「React后端运行时」与「React前端运行时」。

图片

一款rpc协议最基本的组成包括三部分:

  • 数据的序列化与反序列化
  • id映射
  • 传输协议

以上面的OuterServerCpn.server.jsx举例:

// OuterServerCpn.server.jsx
import ClientCpn from './ClientCpn.client'
import ServerCpn from './ServerCpn.server'
export default function OuterServerCpn() {
  return (
    <ClientCpn>
      <ServerCpn />
    </ClientCpn>
  )
}

// ClientCpn.client.jsx
export default function({children}) {
  return <div>{children}</div>;
}

// ServerCpn.server.jsx
export default function() {
  return <div>服务端组件</div>;
}

这段组件代码转化为RSC数据后如下(不用在意数据细节,后文会解释):

M1:{"id":"./src/ClientCpn.client.js","chunks":["client1"],"name":""}
J0:["$","div",null,{"className":"main","children":["$","@1",null,{"children":["$","div",null,{"children":"服务端组件"}]}]}]

接下来我们从上述三个角度分析这段数据结构的含义。

数据的序列化与反序列化

RSC是一种「按行分隔」的数据结构(方便按行流式传输),每行的格式为:

[标记][id]: JSON数据

其中:

  • 「标记」代表这行的数据类型,比如J代表「组件树」,M代表「一个RCC的引用」,S代表Suspense
  • id代表这行数据对应的id。
  • JSON数据保存了这行具体的数据。

RSC的序列化与反序列化其实就是JSON的序列化与反序列化。反序列化后的数据再根据「标记」不同做不同处理。

比如,对于上述代码中第二行数据:

J0:["$","div",null,{"className":"main","children":["$","@1",null,{"children":["$","div",null,{"children":"服务端组件"}]}]}]

可以理解为,这行数据描述了一棵组件树(标记J),id为0,组件树对应数据为:

[
  "$","div",null,{
    "className":"main","children":[
      "$","@1",null,{
        "children":["$","div",null,{
          "children":"服务端组件"}]
        }
      ]
    }
]

当前端反序列化这行数据后,会根据上述JSON数据渲染组件树。

id映射

所谓「id映射」,是指 对于同一个数据,如何在rpc协议传输的两端对应上?

在「RSC协议」的语境下,是指 对于同一个组件,经由RSC在React前后端运行时之间传递,是如何对应上的。

还是考虑上面的例子,回顾下第二行RSC对应的数据:

[
  "$","div",null,{
    "className":"main","children":[
      "$","@1",null,{
        "children":["$","div",null,{
          "children":"服务端组件"}]
        }
      ]
    }
]

这段数据结构有些类似JSX的返回值,把他与组件层级放到一张图里对比下:

图片

可以发现,这些信息已经足够前端渲染<OuterServerCpn/>、<ServerCpn/>组件了,但是<ClientCpn/>对应的数据@1是什么意思呢?

这需要结合第一行RSC的数据来分析:

M1:{"id":"./src/ClientCpn.client.js","chunks":["client1"],"name":""}

M标记代表这行数据是「一个RCC的引用」,id为1,数据为:

{
  "id":"./src/ClientCpn.client.js",
  "chunks":["client1"],
  "name":""
}

第二行中的@1就是指「引用id为1的RCC」,根据第一行RSC提供的信息,React前端运行时知道id为1的RCC包含一个名为client1的chunk,路径为"./src/ClientCpn.client.js"。

于是React前端运行时会向这个路径发起JSONP请求,请求回<ClientCpn/>组件对应代码:

如果应用包裹了<Suspense/>,那么请求过程中会显示fallback效果。

可以看到,通过协议中的:

  • M[id],定义id对应的「RCC数据」。
  • @[id],引用id对应的「RCC数据」。

就能将同一个RCC在React前后端运行时对应上。

那么,为什么RCC不像RSC一样直接返回数据,而是返回引用id呢?

主要是因为RCC中可能包含前端交互逻辑,而有些逻辑是不能通过「RSC协议」序列化的(底层是JSON序列化)。

比如下面的onClick props是一个函数,函数是不能通过JSON序列化的:

<button onClick={() => console.log('hello')}>你好</button>

这里我们再梳理下「RSC协议」中「id映射」的完整过程:

  1. 业务开发时通过.server | client后缀区分组件类型。
  2. 后端代码编译时,所有RCC(即.client后缀文件)会编译出独立文件(这一步是react-server-dom-webpack[3]插件做的,对于Vite,也有人提了Vite插件的实现 PR[4])。
  3. React后端返回给前端的RSC数据中包含了组件树(J标记)等按行表示的数据。
  4. React前端根据J标记对应数据渲染组件树,遇到「引用RCC」(形如M[id])时,根据id发起JSONP请求。
  5. 请求返回该RCC对应组件代码,请求过程的pending状态由<Suspense/>展示。

传输协议

RSC数据是以什么格式在前后端间传递呢?

不同于一些rpc协议会基于TCP或UDP实现,「RSC协议」直接基于「HTTP协议」实现,其Content-Type为text/x-component。

图片

总结

本文从理念、原理角度讲解了RSC,过程中回答了几个问题。

Q:RSC和其他服务端渲染方案有什么区别?

A:RSC是服务端运行时的方案,采用流式传输。

Q:为什么需要区分RSC与RCC(通过文件后缀)?

A:因为RSC需要在后端获取数据后流式传输给前端,而RCC在后端编译时编译成独立文件,前端渲染时再以JSONP的形式请求该文件

Q:为什么RCC中不能import RSC?

A:因为他们的运行环境不同(前者在前端,后者在后端)

由于配置繁琐,并不推荐在现有React项目中使用RSC。想体验RSC的同学,可以使用Next.js并开启App Router:

图片

在这种情况下,组件默认为RSC。

参考资料

[1]体验Demo:https://github.com/reactjs/server-components-demo

[2]how-react-server-components-work:https://www.plasmic.app/blog/how-react-server-components-work

[3]react-server-dom-webpack:https://www.npmjs.com/package/react-server-dom-webpack

[4]Vite插件的实现 PR:https://github.com/facebook/react/pull/26926

责任编辑:姜华 来源: 魔术师卡颂
相关推荐

2014-04-24 11:49:42

DevOps自动化

2021-10-12 08:34:23

React组件前端

2009-04-08 16:42:08

动态架构DI智慧IT

2022-09-19 19:51:30

ReactuseEffect

2021-05-11 07:51:30

React ref 前端

2023-11-16 07:43:26

Next.jsReact

2021-07-21 15:16:53

云原生阿里云云安全

2022-05-25 16:32:36

云原生Cloud

2016-01-14 09:30:46

Hive概念安装使用

2024-05-29 12:50:49

2023-05-26 08:13:49

RSCNext.js开源

2012-04-25 10:02:39

H3CNGIP

2010-08-25 17:05:41

DHCP服务器

2013-08-19 11:55:48

华为HCC大会HCC2013华为

2017-07-25 16:04:31

概念应用强化学习

2009-07-09 18:20:53

云存储云计算云服务

2010-06-03 14:22:01

2012-09-17 09:54:35

云计算云安全

2019-07-12 11:28:00

元数据大数据存储

2014-03-06 09:38:59

微软云计算Windows Azu
点赞
收藏

51CTO技术栈公众号