使用plumbing命令来深入理解git add和git commit的工作原理

前言: plumbing命令 和 porcelain命令

git中的命令分为plumbing命令和porcelain命令:

  • porcelain命令就是我们常用的git add,git commit等命令
  • plumbing命令可以理解为更底层的命令,实际上一个porcelain命令可以由若干个plumbing命令完成(见下文),plumbing命令可以帮助我们了解git底层的工作原理

阅读本文还需要了解.git目录的结构功能,以及git中的对象(commit对象、tree对象、blob对象等等)等概念,请自行参考其他文档。

1. git add

git add file在底层实际上完成了3个步骤:

  1. 根据文件内容计算SHA-1值
  2. 将文件内容存储到仓库的数据库中(.git/objects)
  3. 将文件内容注册到.git/index文件中

下面用plumbing命令完成git add的功能:

------------------------------------------------------------
~ » git init demo
Initialized empty Git repository in /home/lvhao/demo/.git/
------------------------------------------------------------
~ » cd demo
------------------------------------------------------------
~/demo(master) » echo "nihao" >> nihao.txt
------------------------------------------------------------
~/demo(master*) » git status
On branch master No commits yet Untracked files:
(use "git add <file>..." to include in what will be committed) nihao.txt nothing added to commit but untracked files present (use "git add" to track)
~/demo(master*) » git hash-object -w nihao.txt     # 对应于步骤1和2,-w表示写
ba9c1ad3d3b761e84cd8f9e9a18404f6f2552fcf

这时候查看.git/objects目录:

~/demo(master*) » tree .git/objects
.git/objects
├── ba
│   └── 9c1ad3d3b761e84cd8f9e9a18404f6f2552fcf
├── info
└── pack 3 directories, 1 file
~/demo(master*) » git update-index --add --info-only nihao.txt # 对应于步骤3(关于两个参数请参见git help update-index)

上面的update-index,就是更新.git/index文件,有关该文件的详细格式请参考https://*.com/questions/4084921/what-does-the-git-index-contain-exactly。

该index文件主要包含了存在于暂存区(即index)中文件条目,可以通过git ls-files --stage来查看该文件的主要内容:

~/demo(master*) » git ls-files --stage
100644 ba9c1ad3d3b761e84cd8f9e9a18404f6f2552fcf 0 nihao.txt

这时候,nihao.txt已经存在于暂存区(即index),所以说上面的三个步骤相当于git add nihao.txt

~/demo(master*) » git status
On branch master No commits yet Changes to be committed:
(use "git rm --cached <file>..." to unstage) new file: nihao.txt

总结:

porcelain命令:

git add file

等同于plumbing命令:

git hash-object -w file
git update-index --add --info-only file

2. git commit

commit所做的工作实际上是对当前的工作树(working tree)拍一个”快照“然后保存起来,git commit在底层实际上完成的步骤:

  1. 根据当前的工作树生成一个tree对象(tree对象记录了当前工作目录的结构,保存有对当前版本的文件的引用),将tree对象保存到.git/objects下
  2. 由上述tree对象生成一个commit对象,(可选)并指明该commit对象的parent、message等信息
  3. 移动分支到新生成的commit对象
# 继续上面的代码
~/demo(master*) » git write-tree # 即步骤1
8e335a3e0ffa15ff97acc7f4d97e03d63612ec7a

让我们查看一下这个tree对象,可见它保存了对当前工作目录下文件/目录的引用:

~/demo(master*) » git cat-file -p 8e335a
100644 blob ba9c1ad3d3b761e84cd8f9e9a18404f6f2552fcf nihao.txt
~/demo(master*) » git commit-tree -m "Initial Commit" 8e335a    # 即步骤2
1f1fbcf8ff46d8d2548372c38cf3f1eabf8bfbc8 # 新生成的commit的SHA-1

这时候我们查看状态,还是待commit状态,这是因为commit-tree仅仅是生成了一个新的commit对象,并不会导致HEAD及分支的移动:

~/demo(master*) » git status
On branch master No commits yet Changes to be committed:
(use "git rm --cached <file>..." to unstage) new file: nihao.txt

为了利用当前的分支,我们需要修改分支的引用,git update-ref refs/heads/分支名 commit-hash命令来更新分支的位置到刚刚创建的commit:

~/demo(master*) » git update-ref refs/heads/master 1f1fbc  # 即步骤3

由于.git/HEAD默认就是指向master分支,所以得到如下结果:

~/demo(master) » git status
On branch master
nothing to commit, working tree clean

查看一下提交日志:

~/demo(master) » git log --graph --oneline
* 1f1fbcf (HEAD -> master) Initial Commit

总结:

porcelain命令的:

git commit -m "xxx" file

等同于plumbing命令的:

git write-tree # 得到tree的hash: tree-hash
git commit-tree -m "xxx" (-p parent-hash) tree-hash # 得到commit的hash,commit-hash
git update-ref refs/heads/分支名 commit-hash
上一篇:Git 思想和工作原理


下一篇:git教程1-git工作原理与初始化仓库