一个让 Git Clone 提速几十倍的小技巧

开发 项目管理
不知道大家有没有遇到比较大的项目,git clone 很慢很慢,甚至会失败的那种。大家会怎么处理的呢?

[[403380]]

 本文转载自微信公众号「神光的编程秘籍」,作者神说要有光。转载本文请联系神光的编程秘籍公众号。

不知道大家有没有遇到比较大的项目,git clone 很慢很慢,甚至会失败的那种。大家会怎么处理的呢?

可能会考虑换一个下载源,可能会通过一些手段提高网速,但是如果这些都试过了还是比较慢呢?

今天我就遇到了这个问题,我需要把 typescript 代码从 gitlab 下载下来,但是速度特别慢:

  1. git clone https://github.com/microsoft/TypeScript ts 

等了很久还是没下载完,于是我加了一个参数:

  1. git clone https://github.com/microsoft/TypeScript --depth=1 ts 

这样速度提高了几十倍,瞬间下载完了。

加上 --depth 会只下载一个 commit,所以内容少了很多,速度也就上去了。

而且下载下来的内容是可以继续提交新的 commit、创建新的分支的。不影响后续开发,只是不能切换到历史 commit 和历史分支。

我用我的一个项目测试过,我首先下载了一个 commit:

然后做一下改动,之后 git add、commit、push,能够正常提交:

创建新分支也能正常提交。唯一的缺点就是不能切换到历史 commit 和历史分支。

在一些场景下还是比较有用的:当需要切换到历史分支的时候也可以计算需要几个 commit,然后再指定 depth,这样也可以提高速度。

大家有没有想过,这样能行的原理是什么?

git 原理

git 是通过一些对象来保存信息的:

  • glob 对象存储文件内容
  • tree 对象存储文件路径
  • commit 对象存储 commit 信息,关联 tree

以一个 commit 为入口,关联的所有的 tree 和 blob,就是这个 commit 的内容。

commit 之间相互关联,而 head、branch、tag 等是指向具体 commit 的指针。可以在 .git/refs 下看到。这样就基于 commit 实现了分支、tag 等概念。

git 就是通过这三个对象来实现的版本管理和分支切换的功能,所有 objects 可以在 .git/objects 下看到。

这就是 git 的原理。

主要理解 blob、tree、commit 这三个 object,还有 head、tag、branch、remote 等 ref。

能下载单个 commit 的原理

我们知道了 git 是通过某一个 commit 做为入口来关联所有的 object,那如果我们不需要历史自然就可以只下载一个 commit。

这样依然基于那个 commit 创建新的 commit,关联新的 blob、tree 等。但是历史的 commit、tree、blob 因为都没有下载下来所以无法切回去,相应的 tag、branch 等指针也不行。这就是我们下载了单个 commit 却依然可以创建新的分支、commit 等的原理。

总结

遇到大的 git 项目的时候,可以通过添加 --depth 参数使得速度极大提升,历史 commit 越多,下载速度提升越大。

而且下载下来的项目依然可以进行后续开发,可以创建新的 commit 和新的分支、tag,只是不能切换到历史 commit、分支、tag。

我们梳理了 git 的原理:通过 tree、blob、commit 这三个 object 来存储文件和提交信息,通过 commit 之间的关联来实现分支、标签等功能。commit 是入口,关联所有的 tree 和 blob。

我们下载了一个 commit,就是下载了他关联的所有 tree、blob,还有一些 refs (包括tag、branch 等),这就是 --depth 的原理。

希望大家在不需要切换到历史 commit 和分支的场景下可以用这个技巧来提升大项目的 git clone 速度。

 

责任编辑:武晓燕 来源: 神光的编程秘籍
相关推荐

2019-03-27 13:45:44

MySQL优化技巧数据库

2022-03-19 23:20:57

加密货币安全信息泄漏

2022-04-19 14:03:23

加密货币NFT安全

2022-10-27 07:09:34

DjangoAPIRedis

2024-04-19 14:50:00

find文件查找

2023-02-23 10:21:17

ChatGPT人工智能

2023-06-13 13:52:00

Java 7线程池

2024-06-27 11:22:34

2020-09-16 16:07:34

Chrome插件浏览器

2009-05-07 09:52:21

英特尔无线吉比特联盟无线网络

2021-06-16 10:50:16

Python代码优化

2021-05-07 16:02:54

Python代码优化

2017-09-26 14:56:57

MongoDBLBS服务性能

2024-02-26 18:11:08

Docker容器镜像

2019-11-18 17:45:45

金蝶国际

2009-12-31 16:15:42

VPN以太网接入技术

2022-10-31 15:50:06

AI发帖

2021-09-06 10:25:27

Python代码优化

2020-07-08 17:06:00

Python开发工具

2023-09-07 11:29:36

API开发
点赞
收藏

51CTO技术栈公众号