5.9 KiB
记录一下GIT的各种删除操作,删除操作用的比较少,经常忘记,每次要用的时候都现搜
删除Git历史提交中的大文件
作者:阿斯蒂芬 链接:https://www.zhihu.com/question/54419234/answer/2538641471 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
-
显示大文件路径与文件名
-
- 以便分析文件类型, 后续通过适配符批量删除
-
追查大文件来源
-
- 分析来自哪个branch哪个commit, 由谁提交
- 以便预防类似问题二次发生
1.显示当前最大的10个文件:
git verify-pack -v .git/objects/pack/pack-*.idx | sort -k 3 -g | tail -10
会显示类似如下列表(共10行), 其中第一大段为文件的ID
10d4c5bea321160601323af6464277f5c0000000 blob 7367001 6000049 160008000
7d48cc9a0000000000abbd55aeda21207db1d4 blob 7367000 6100048 160008924
2. 根据ID 反查文件名(二选一)
2.1 只需要文件名(简单场景)
git rev-list --objects --all |grep 10d4c5bea321160601323af6464277f5c0000000
2.2 反查更详细的文件信息(多branch场景)
git whatchanged --all --find-object=10d4c5bea321160601323af6464277f5c0000000
输出将会包含以下信息:
- commit (branch)
- Author
- Date
- path and file name
3. 根据文件名在历史记录中批量删除
替换下列代码中的 path_to_file为希望删除的文件名, 支持*通配符
git filter-branch --force --index-filter 'git rm --cached --ignore-unmatch path_to_file' --prune-empty --tag-name-filter cat -- --all
举例:
git filter-branch --force --index-filter 'git rm --cached --ignore-unmatch */*/*.png' --prune-empty --tag-name-filter cat -- --all
如果你的文件名包含空格, 则应交替使用单双引号:
git filter-branch --force --index-filter \ "git rm --cached --ignore-unmatch 'src/file name with blank'"
注意: 只能删除当前所在branch的文件, 所以如果文件来自于另一个branch, 应先切换branch:
git checkout that_branch
如果删除文件的所在分支已经不存在,可以通过查看日志恢复那个分支
#通过git reflog找到最后一次的提交记录
git reflog
#进行恢复 比如要恢复的分支名和提交记录id分别为dev-web-config 3c96c99
git checkout -b git checkout -b dev-web-config 3c96c99
预期terminal输出:
少量文件成功被删除: rm 'some-file.png'
大量历史commit被重写: Rewrite 7930b2dd7bff910000000000000000001a8cdf7014 (1512/1721) (41 seconds passed
最终一些branch可能没有变化: WARNING: Ref 'a_branch' is unchanged
但是有些branch被改写了: b_branch -> b_branch
4. (可选项) 更新本地Git仓库
删除操作之后, 再用第2步的指令查询对应ID不会返回任何值, 表明文件已删除;
但用第1步的指令查询前10的大文件会发现列表并没有变化, 如需要查询经过上一步删除之后的新前10大文件, 则需要更新本地Git仓库
(ps. 也可以将第1步指令末尾改为20, 查看前20的大文件)
此时你会发现本地目录中的.git文件并不会马上就变小,而是与原来是一样的, 是因为Git仓库历史有个缓存期,如果不主动回收、清理仓库历史,一般的这些记录还会保存一段时间,以备你突然后悔了,没办法找回删掉的文件。 通过以下命令主动回收资源:
rm -rf .git/refs/original/
git reflog expire --expire=now --all
git gc --prune=now
git gc --aggressive --prune=now
以上仓库更新代码, 合并至一行:
rm -rf .git/refs/original/;git reflog expire --expire=now --all;git gc --prune=now;git gc --aggressive --prune=now
5. 更新到远程服务器
git push --force --all
如果出现提示remote: GitLab: You are not allowed to force push code to a protected branch on this project. 需要在gitlab里面取消分支protected
在多人共同修改的分支上, 建议改用以下命令进行push, 以预防冲突
git push --force-with-lease
6.(可选项)在其他本地机器上进行强制更新
即如何进行force pull.
这里以master branch为例:
git checkout master
git branch new-branch-to-save-current-commits
git fetch --all
git reset --hard origin/master
如果有删除远程分支操作:
git branch -D <branch-name-to-delete>
git remote update origin --prune
删除因为.gitignore未设置忽略上传到远程仓库的文件
有些新项目可能没有设置好.gitignore导致上传一些文件到远程仓库,比如``.vscode,
.idea`这种文件
一般处理方式我说三种:
1.在仓库中添加一个.gitignore文件,可以忽略指定文件夹或文件,从而避免将.idea文件夹提交上去。在.gitignore文件中添加以下代码即可忽略.idea文件夹内容,(删除不掉已经上传到远程的)
.idea/
2.使用git filter-branch命令,将.idea文件夹从提交历史中删除。这个方法需要谨慎使用,因为它可以修改提交历史,可能会影响到其他人的工作。如果确定只有自己在使用该仓库,可以使用以下命令:
git filter-branch --tree-filter 'rm -rf .idea' HEAD
3.使用git rm命令,删除.idea文件夹,并将删除的操作提交到仓库中。这种方法简单易行,但是需要注意的是,需要先提交一个删除操作,才能生效。具体的步骤如下:
git rm -r --cached .idea
git commit -m "remove .idea folder"
git push origin master
建议第一种和第二种配合使用