本节向大家简单介绍一下SVN功能和CVS功能比较,主要包括七个方面,在这里和大家分享一下,希望通过本节的学习你对SVN功能和CVS功能的不同之处有所了解,下面是SVN功能和CVS功能的具体介绍。
SVN与CVS的对比——功能性对比
一、SVN包含绝大部分CVS功能
SVN作为CVS的重写版和改进版,其目标就是作为一个更好的版本控制软件,取代目前流行的CVS。SVN功能的主要开发人员都是业界知名的CVS专家。SVN支持绝大部分的CVS功能/命令;SVN的命令风格和界面也与CVS非常接近。当然,不同的地方正是对CVS的改进。
二、全局性的版本编号
一个新的版本,并得到一个自增量的版本号N+1,该版本号并不针对某个特定的文件,而是全局性的、针对整个版本库的。因此,我们可以将SVN的版本库看作是一个文件系统或文件目录树的数组。
从技术的角度来说,在SVN功能中,“文件foo.c的第5版本”这个说法是错误的;正确的说法应该是:”文件foo.c在版本库被修改了5次,即执行5次commit后是什么样子?”。显然,在SVN中,版本库被修改5次后foo.c的内容,和被修改了6次后foo.c的内容很可能完全一样,因为版本库的第6次修改很可能只修改了版本库的其他部分,而并没有对foo.c的进行修改。相反,在CVS中,文件foo.c的第1.1版本和第1.2版本总是不同的。
SVN的全局性版本编号为SVN带来了诸多的优势:如对目录或文件执行拷贝,无论涉及多少文件,SVN不需要对单个文件依次执行拷贝命令,仅仅需要建立一个指向相应的全局版本号的一个指针即可。
三、目录的版本控制
CVS只能对文件进行版本控制,不能对目录进行版本控制,因此CVS没有任何关于文件“移动”(move)操作的概念。当人为进行文件移动操作时,CVS只能注意到,一个文件在一个位置被删除了,而在一个新位置创建了另外一个文件。由于它不会连接两个操作,因此也很容易使文件历史轨迹丢失。设置CVS存储库时,必须非常谨慎地为每个文件选择准确的位置,因为在设置之后,几乎就要一直使用这个位置了。
同样由于CVS不记录目录的版本历史,CVS不支持对文件的“重命名”(rename),人为的对文件进行重命名会使得命名前后的文件失去历史联系,而记录历史本来是版本管理的主要目的。
还有,CVS不支持对文件的“拷贝”(copy),人为的拷贝对CVS而言,只能看到新的文件的增加,而不能记录拷贝源文件和目标文件之间的联系。
综上所述,缺乏对文件“移动”、“重命名”、“拷贝”的支持的根源在于CVS不能记录目录的版本历史,而这些操作在当前的软件开发过程中经常发生,这正是SVN被开发并取代CVS的主要原因之一。
SVN将目录作为一类特殊的文件来处理(事实上,从文件系统的角度来看,目录确实是一类特殊的文件,当目录中的子目录/文件被删除、重命名、或新的子目录/文件被创建时,目录的内容将发生改变)。因此,SVN象记录普通文件的修改历史一样记录对目录的修改历史,当发生文件/目录的移动、重命名或拷贝操作时,SVN能够准确记录操作前后的历史联系。同样,象对文件的不同历史版本进行比较一样,SVN支持对目录的不同历史版本的比较,清晰展现目录的变化历史。
四、原子性提交
从使用者的角度来看,CVS和SVN功能都支持对多个文件修改的批量提交,但二者在实现方式上存在本质的区别。
CVS采用线性、串行的批量提交,即依次地,一个接一个地执行提交,每成功提交一个文件,该文件的一个新的版本即被记录到版本库中,提交时用户提供的日志信息被重复地存储到每一个被修改的文件的版本历史中。
CVS串行批量提交模式的弊端在于-当任何原因造成批量操作的中断时(典型原因包括:网络中断、客户端死机等),版本库往往处于一个不一致的状态:原本应该全部入库的文件只有一部分入库,很有可能版本库中的***版本不能顺利编译,更为严重的是,随着其他的用户执行cvsupdate操作,该不一致性将迅速在开发团队中扩散,从而严重影响团队的开发效率,并存在质量隐患。另外,假如该批量提交的中断没有被及时发现,开发团队往往要花更多的时间进行软件调试和排错。
CVS即使在批量提交不发生中断时也会造成不一致:假设用户A启动一个需要较长时间才能完成的批量提交;与此同时,用户B执行cvsupdate操作。此时,用户B很有可能得到一个不一致的更新,即用户B通过“更新”操作,得到用户A的部分修改文件。
SVN彻底消除了CVS的以上弊端。无论批量提交包含多少文件修改,只有当全部文件修改都成功入库,该提交才变得有效,才对其他用户可见;否则,无论任何原因造成中断,SVN都会自动执行“回滚”(rollback)操作。换一个说法,SVN保证所有的修改要么全部入库生效,要么一个也不入库,即对版本库不作任何的修改。这就是SVN的原子性提交(atomiccommit)。
由于SVN的原子性提交特性和全局版本编号方式,当提交成功完成时,一个唯一的、新的全局版本编号产生,而提交时用户提供的日志信息与该新的版本编号关联,只进行一次存储(区别于CVS的按文件重复存储)。
五、支持变更集概念
由于SVN功能中所有提交是原子性的,每次成功提交形成的唯一的全局版本号对应此次批量提交的所有文件修改,也就是说,一个SVN版本号其实对应了一个逻辑上的变更集(changeset),该变更集可能对应于对一个BUG的修复,或者对应于对一个已有功能的改进,或者对应于一个新功能的实现。可以说,变更集是一个软件开发活动的逻辑结果,该变更集可以通过其对应的版本号在软件开发的其他过程中(如软件合并/集成过程,软件发布管理,变更管理系统,缺陷追踪系统)被引用。因此,SVN将版本管理从单纯的、单个的文件修改的层次通过逻辑上的抽象,上升到更便于理解和交流的开发活动的层次。
六、差异化的二进制文件处理
由于历史原因,CVS主要是为早期的程序员设计的,CVS能够有效处理文本文件(或ASCII文件,源代码文件),可以对文本文件进行差异化的存储、新旧版本的比较,文件合并等;但对于二进制文件,CVS则明显力不从心。在CVS的版本库中,对于二进制文件的历史版本,CVS唯一能做的就是对不同的版本进行独立的、冗余的存储,哪怕版本之间其实只存在微小的差异。举例而言,一个10M的二进制文件(照片、图形文件、机械设计文件、电子设计文件)假如每周修改一次,无论每次修改的大小,一年下来,仅该文件就要消耗500M以上的存储空间。而且,客户端每次获取该文件的新版本都要消耗10M的网络流量。
对于目前的开发团队,无论是软件开发,Web站点的开发,手机等电子产品的研发,需要进行版本管理的不仅是源代码等文本文件,还需要管理需求文档、设计文档、测试文档、用户手册,图形图像文件,机械/电子设计文件等诸多的二进制文件,CVS显然不是一个好的选择。
与CVS不同,SVN采用统一的二进制差异算法(binarydifferencingalgorithm),即对文本文件和二进制文件采用相同的差异比较算法,并以相同的方式在版本库中进行存储:每次提交后版本库中只存储相对于先前版本的差异,从而可以节省大量的存储空间。
该二进制差异算法不仅应用在版本的存储上,更为重要的是,SVN对二进制文件与文本文件一视同仁,当客户端需要获取新的版本时(如执行svnupdate),在网络上只有版本的差异被传输,从而大大减少对网络带宽的消耗。更多细节参见“七、双向的差异化-压缩网络传输”。SVN功能和CVS功能对比介绍中差异化的二进制文件处理讲解完毕。
七、双向的差异化-压缩网络传输
如上所述,CVS对二进制文件不能进行有效的差异化处理。对于文本文件,CVS功能仅仅支持单向的差异化传输:从CVS服务器到客户端的传输是差异化的,即执行cvsupdate时,只有差异的部分从服务器传输到客户端;而当执行cvscommit时,无论代码变化多少,CVS都需要从客户端向服务器完整传输被修改文件的全部内容,不能只传输差异。
相反,无论是文本文件还是二进制文件,SVN都进行双向的差异化传输,并且差异化内容还要进行压缩/解压缩的过程:在服务器端获取差异显而易见,与CVS类似;SVN在客户端获取差异的秘密在于—SVN在客户端的工作拷贝中隐含了每个文件的一个“只读的、干净的”副本(该副本隐藏在隐含目录.svn里,通常不可见,该副本还有更多的妙用,参见“十二、更多的本地/离线操作”),通过比较用户在客户端的修改和该隐含的副本,SVN获取需要真正传送到服务器的差异,并对差异进行压缩后才进行网络传输。
对CVS而言,操作的成本(网络带宽消耗是***的操作成本)与被修改的文件的大小成比例,而与修改本身的大小无关;对SVN而言,操作成本只与修改本身的大小成比例,而与被修改的文件的大小无关。因此,与CVS相比,SVN消耗更少的网络带宽(以客户端的存储空间换取更少的带宽消耗在目前的计算环境下应该是个相当不错的选择!)。SVN更加适合基于互联网(或广域网)进行协作开发的地理上分布的团队——版本服务器集中、单一;客户端广泛分布。请期待下节关于SVN功能和CVS功能对比介绍。
【编辑推荐】