前言
随着版本的演进和更新,OpenHarmony的代码量越来越大,非常消耗磁盘空间。以 v4.1-Release 版本为例,参考官方文档提供的以下四条命令获取的OpenHarmony代码已经接近50G(包含//.repo/、//prebuilts/、checkout到工作区的代码和通过git lfs pull下载的大文件):
如果完成了三类系统(轻量、小型、标准)的全编译,则会产生几十个G的 .ccache 和几十个G的 //out/ ,整体已经占用超过150G的磁盘空间了。
下面我们组合使用repo和git命令的一些参数,可以大幅减小OpenHarmony代码的磁盘占用空间。
repo sync -m 参数
在repo sync 命令增加 -m 参数,指定只同步(下载或clone)manifest仓库中的某个manifest文件。
例如,不使用 -m 参数的官方命令:
会在 //.repo/manifest.xml 中指定同步 //.repo/manifests/default.xml 文件,该文件中
会指定下载全量的OpenHarmony代码,包括了开源出来的所有chipsets仓库代码,这样会包含我们并不需要的非常多的仓库。
而通过增加 -m 参数则可以只下载我们需要的chipsets仓库代码,例如:
上述命令增加 “-m chipsets/hispark_taurus.xml” 后,//.repo/manifest.xml 的描述则会指定同步 //.repo/manifests/chipsets/hispark_taurus.xml 文件:
这样可以节省不少磁盘空间。
如果我们还需要其它的chipsets的manifest,那我们可以直接手动修改 //.repo/manifest.xml 的描述,按规则增加对应的chipsets的manifest即可。
或者,不加 -m 参数,也可以直接修改 //.repo/manifests/default.xml 文件的描述,再去repo sync,也可以达到同样的效果:
repo sync -g 参数
在repo sync 命令增加 -g 参数,可以对各仓库的groups字段进行过滤,匹配 -g 参数的仓库才会同步(下载或clone)到本地。例如:
但是需要注意,这个 groups 标签,看上去维护得并不好,甚至有些混乱。
有些仓库只适用于标准系统,也添加了ohos:mini,ohos:small标签;有些仓库虽然没有ohos:mini,ohos:small标签,但是在执行 ./build/prebuilts_download.sh 时,则是需要依赖到的;有些仓库则没有ohos:mini,ohos:small标签,但会在编译过程中或者镜像打包阶段依赖到而导致编译错误;这些都需要根据实际情况自行修改 ohos.xml 中对应仓库的 groups 标签然后再同步和编译代码。
repo sync --depth 参数
ohos.xml 中对Linux内核仓库的描述:
有一个 clone-depth=“1” 的字段,该字段表示在同步(下载或clone)远程仓库到本地时,只下载远程仓库默认分支的最新一次提交记录到本地,而不是将所有的历史记录都同步到本地,这样可以大幅减少仓库代码的磁盘占用空间。
如果只想对某些仓库(特别是历史记录特别长的仓库)做 clone-depth="num"的操作,可以像上面一样,在对应仓库的描述信息增加 clone-depth=“num” 字段就行了;如果想对所有仓库进行一次性的操作,那就给 repo sync 命令增加一个 --depth 参数。例如:
git --depth 参数
通过 repo sync --depth=1 参数拉取的OpenHarmony代码,默认只获取远程仓库默认分支的最新一次提交记录到本地,并不包含更多的历史提交记录和其他费默认分支的记录。
对某个具体仓库,可以通过git命令和参数进行一些操作,获取更多的历史提交记录和其他费默认分支的记录到本地。
git 的 --depth参数:
即在默认的 --single-branch 情况下,只获取默认分支到本地;如果要查看其他分支的代码和提交记录,可以按如下一些操作进行处理。
git-sparse-checkout 参数
对于特定的仓库,git 还有一个稀疏检出的操作可以稍微减少checkout的代码量,更重要的是这个参数可以让工作区的代码目录更清爽。
例如,对于 //vendor/hisilicon/ 仓库,默认是:
这里面有很多项目是我们平常基本上用不到也改不到的,放在这里很碍眼,通过hb set选择项目时,也会出现太多的选项,因此,可以使用git-sparse-checkout的配置来只checkout我们想要的文件夹(项目)。
可以在这个仓库目录下执行:
该命令会在 //vendor/hisilicon/.git/config 文件的 [core] 段新增一个 sparsecheckout = true 的配置,enable 了sparsecheckout 功能,然后再执行:
作用都是将需要checkout的目录和文件列表写入到 //vendor/hisilicon/.git/info/sparse-checkout 文件中去,而不在该文件中的目录和文件则不会checkout出来(但这些文件的objects对象,还是在本地仓库中的,只是没有解压到工作区而已),而我们的修改和提交,也不会影响到未checkout的目录和文件。
当我们需要把全部的目录和文件列表全部checkout出来的时候,可以直接执行:
然后重新checkout一下当前的分支即可。
注意:
实测发现,是否执行 “git config core.sparsecheckout” 命令来enable或disable sparsecheckout都没关系(不知道是git版本问题还是bug),只要有 .git/info/sparse-checkout 文件,都可以通过改写该文件达到稀疏检出的目的。
补充
经过上述命令和参数的组合使用,可以大幅减少OpenHarmony仓库和代码所占用的磁盘空间,但是三大巨头(//prebuilts/、//out/、.ccache)仍然是占用着非常大的磁盘空间。