第一章:Git简介

一 Git是什么

​ Git是目前世界上最先进的分布式版本控制系统(没有之一)。

​ Git有什么特点?简单来说就是:高端大气上档次!

​ 那什么是版本控制系统?

​ 如果你用Microsoft Word写过毕业论文,那你一定有这样的经历:

​ 想删除一个段落,又怕将来想恢复找不回来怎么办?有办法,先把当前文件“另存为……”一个新的Word文件,再接着改,改到一定程度,再“另存为……”一个新文件,这样一直改下去,最后你的Word文档变成了这样:

​ 这种手动的复制文件来管理内容版本的方式,有很多让人抓狂的地方:

​ 1、版本回退麻烦

过了一周,你想找回被删除的文字,但是已经记不清删除前保存在哪个文件里了,只好一个一个文件去找,真麻烦。

​ 2、乱起八糟的

看着一堆乱七八糟的文件,眼下用得上的只是最新的那一个,其他的想要删掉,又怕哪天会用上,还不敢删,真郁闷。

​ 3、协作麻烦:编辑麻烦、合并麻烦

更要命的是,有些部分需要你的同学/朋友帮助填写,于是你把文件Copy到U盘里给她(也可能通过Email发送一份给她),然后,你继续修改Word文件。一天后,同学/朋友再把Word文件传给你,此时,你必须想想,发给她之后到你收到她的文件期间,你作了哪些改动,得把你的改动和她的部分合并,真困难。

​ 于是你想,如果有一个软件,能够支持至少下述操作,那

​ 1、能自动帮我记录每次文件的改动,可以支持我们回退到任何一个历史版本

​ 2、每次只呈现给我们最新版本的那个文件就好了

​ 3、还可以让同事协作编辑,这样就不用自己管理一堆类似的文件了,也不需要把文件传来传去。如果想查看某次改动,只需要在软件里瞄一眼就可以,

​ 那岂不是很方便?这个软件用起来就应该像这个样子,能记录每次文件的改动:

​ 这样,我们从手动管理多个“版本”的泥潭中解脱出来了,于是,应运而生了一批版本控制软件:VSS、CVS、SVN、Git等,其中Git属于绝对霸主地位。

注意:一般版本控制工具包含两部分

  • 客户端(本地):本地编写内容以及版本记录
  • 服务端(网盘):将内容和版本记录同时保存在远程(可有可无)

二 Git的诞生

很多人都知道,Linus在1991年创建了开源的Linux,从此,Linux系统不断发展,已经成为最大的服务器系统软件了。

Linus虽然创建了Linux,但Linux的壮大是靠全世界热心的志愿者参与的,这么多人在世界各地为Linux编写代码,那Linux的代码是如何管理的呢?

事实是,在2002年以前,世界各地的志愿者把源代码文件通过diff的方式发给Linus,然后由Linus本人通过手工方式合并代码!

你也许会想,为什么Linus不把Linux代码放到版本控制系统里呢?不是有CVS、SVN这些免费的版本控制系统吗?因为Linus坚定地反对CVS和SVN,这些集中式的版本控制系统不但速度慢,而且必须联网才能使用。有一些商用的版本控制系统,虽然比CVS、SVN好用,但那是付费的,和Linux的开源精神不符。

不过,到了2002年,Linux系统已经发展了十年了,代码库之大让Linus很难继续通过手工方式管理了,社区的弟兄们也对这种方式表达了强烈不满,于是Linus选择了一个商业的版本控制系统BitKeeper,BitKeeper的东家BitMover公司出于人道主义精神,授权Linux社区免费使用这个版本控制系统。

安定团结的大好局面在2005年就被打破了,原因是Linux社区牛人聚集,不免沾染了一些梁山好汉的江湖习气。开发Samba的Andrew试图破解BitKeeper的协议(这么干的其实也不只他一个),被BitMover公司发现了(监控工作做得不错!),于是BitMover公司怒了,要收回Linux社区的免费使用权。

Linus可以向BitMover公司道个歉,保证以后严格管教弟兄们,嗯,这是不可能的。实际情况是这样的:

Linus花了两周时间自己用C写了一个分布式版本控制系统,这就是Git!一个月之内,Linux系统的源码已经由Git管理了!牛是怎么定义的呢?大家可以体会一下。

Git迅速成为最流行的分布式版本控制系统,尤其是2008年,GitHub网站上线了,它为开源项目免费提供Git存储,无数开源项目开始迁移至GitHub,包括jQuery,PHP,Ruby等等。

历史就是这么偶然,如果不是当年BitMover公司威胁Linux社区,可能现在我们就没有免费而超级好用的Git了。

三 集中式vs分布式

Linus一直痛恨的CVS及SVN都是集中式的版本控制系统,而Git是分布式版本控制系统,集中式和分布式版本控制系统有什么区别呢?

简单地讲:

​1、集中式
(1)必须有中央服务器
(2)中央服务器存放所有的版本信息,程序员的机器上只有某个版本
(3)程序的开发工作离不开中央服务器,因为需要将新版本提交到中央服务器or从中央服务器拉下来最新版本进行开发

​2、分布式
(1)可以有中央服务器
(2)中央服务器存放所有的版本信息,程序员的机器上也保存了所有版本
(3)中央服务器存在的核心意义就是一个网盘的作用,即便没有中央服务器,程序员照样可以工作

详细地讲

  • 1、集中式

    所有的历史版本文件被保存在一个中央服务器中,而干活的时候,每名程序员用的都是自己的个人电脑,所以所有人都需要先从中央服务器取得最新的版本,然后开始干活,干完活了,再把自己的活推送给中央服务器。中央服务器就好比是一个图书馆,你要改一本书,必须先从图书馆借出来,然后回到家自己改,改完了,再放回图书馆

​ 集中式最大的缺点就是:必须联网才能工作

1、如果中央服务器放置于局域网环境中,那么带宽、速度都可以得到保障,但程序员回家就加不了班了,对于广大热爱代码的程序员来说,这是不能忍的,
2、如果中央服务器公开在互联网上,那么带宽、网速就被限制住了,网速慢的话,可能提交一个10M的文件就需要5分钟,这还不得把人给憋死啊。
  • 2、分布式

    分布式版本控制系统根本没有“中央服务器”,每个人的电脑上都是一个完整的版本库,这样,你工作的时候,就不需要联网了,因为版本库就在你自己的电脑上,此时就好比每个人都建了一个自己的图书馆。

    既然每个人电脑上都有一个完整的版本库,那多个人如何协作呢?比方说你在自己电脑上改了文件A,你的同事也在他的电脑上改了文件A,这时,你们俩之间只需把各自的修改推送给对方,就可以互相看到对方的修改了。

    和集中式版本控制系统相比,分布式版本控制系统的安全性要高很多,因为每个人电脑里都有完整的版本库,某一个人的电脑坏掉了不要紧,随便从其他人那里复制一个就可以了。而集中式版本控制系统的中央服务器要是出了问题,所有人都没法干活了。

    在实际使用分布式版本控制系统的时候,其实很少在两人之间的电脑上推送版本库的修改,因为可能你们俩不在一个局域网内,两台电脑互相访问不了,也可能今天你的同事病了,他的电脑压根没有开机。因此,分布式版本控制系统通常也有一台充当“中央服务器”的电脑,但这个服务器的作用仅仅是用来方便“交换”大家的修改,没有它大家也一样干活,只是交换修改不方便而已。

当然,Git的优势不单是不必联网这么简单,后面我们还会看到Git极其强大的分支管理,把SVN等远远抛在了后面。

CVS作为最早的开源而且免费的集中式版本控制系统,直到现在还有不少人在用。由于CVS自身设计的问题,会造成提交文件不完整,版本库莫名其妙损坏的情况。同样是开源而且免费的SVN修正了CVS的一些稳定性问题,是目前用得最多的集中式版本库控制系统。

除了免费的外,还有收费的集中式版本控制系统,比如IBM的ClearCase(以前是Rational公司的,被IBM收购了),特点是安装比Windows还大,运行比蜗牛还慢,能用ClearCase的一般是世界500强,他们有个共同的特点是财大气粗,或者人傻钱多。

微软自己也有一个集中式版本控制系统叫VSS,集成在Visual Studio中。由于其反人类的设计,连微软自己都不好意思用了。

分布式版本控制系统除了Git以及促使Git诞生的BitKeeper外,还有类似Git的Mercurial和Bazaar等。这些分布式版本控制系统各有特点,但最快、最简单也最流行的依然是Git!

四 github

GitHub是一个基于Git的远程文件托管平台(同GitCafe、BitBucket和GitLab等)。

Git本身完全可以做到版本控制,但其所有内容以及版本记录只能保存在本机,如果想要将文件内容以及版本记录同时保存在远程,则需要结合GitHub来使用。使用场景:

  • 无GitHub:在本地 .git 文件夹内维护历时文件
  • 有GitHub:在本地 .git 文件夹内维护历时文件,同时也将历时文件托管在远程仓库

五 git安装

安装参见:http://git-scm.com/,mac与windows下都是点点鼠标的事情,不必啰嗦,linux下也不必啰嗦就是解压、./configure、make、make install的事情

上一篇
下一篇
Copyright © 2022 Egon的技术星球 egonlin.com 版权所有 帮助IT小伙伴学到真正的技术