Git历史数据清理:运用BFG删除敏感信息。

简介: 通过使用BFG Repo-Cleaner,你可以确保你的Git历史记录自由于敏感数据,而不需要为手动清理每一个提交而烦恼。不仅如此,BFG的效率极高,对于大型的存储库和长期的提交历史,其表现出色,即使在处理数万个提交和GB级别的数据时,也能快速和有效的清理Git历史。

Git是如今最受欢迎的分布式版本控制系统,可以帮助开发者有效地追踪和管理源代码历史。然而,有时,敏感信息,例如密码、API密钥或别的密文,可能误以为是普通的代码添加到版本库中,这在开源项目中是个常见问题,可能会导致严重的隐私和安全问题。

这种状况下,你可能想要从Git历史数据中彻底删除这些敏感信息。在这个过程中,BFG Repo-Cleaner就发挥了重要作用。BFG是一个工具,比git-filter-branch更快、更简单,专为清理你的Git Repositor而设计。

BFG拿来就可以使用,它更加效率,并且有一个合理的安全模式。它能快速录取历史提交,查找和修改指定文件或文件类型,然后再自动清理和最小化Git存储库。

下面就是一些简单的步骤,可以帮助你使用BFG清理敏感信息:

步骤一:安装BFG Repo-Cleaner

你可以在你的机器上使用以下命令安装BFG:

$ brew install bfg
​

或者,你也可以从BFG的GitHub页面下载.jar文件。

步骤二:克隆一个裸存储库

假设你的项目存储库地址为:https://github.com/username/myrepo.git ,使用以下命令生成裸存储库:

$ git clone --mirror https://github.com/username/myrepo.git
​

这将在你的当前目录下创建一个 myrepo.git目录。记住,这是一个裸存储库,你不会在其中看到通常的工作目录文件。

步骤三:运行BFG来清除数据

接下来,我们将具体操作BFG来清除已知的敏感文件。使用以下命令:

$ bfg --delete-files mysecrets.txt myrepo.git
​

其中,mysecrets.txt是你想要从所有Git历史记录中删除的文件。

步骤四:清洗你的存储库

现在,删除所有标签(引用)到你的旧提交:

$ cd myrepo.git
$ git reflog expire --expire=now --all && git gc --prune=now --aggressive
​

这会清理你的存储库并从中删除所有的旧提交。

步骤五:推送清洗后的存储库

最后,你可以把清洗过的存储库推送回远端:

$ git push --all
​

请注意,这会覆盖你远端的Git历史,所以在推送之前,确保其他人都已经拉取了最新的更改,以防他们在你删除历史之后又重新推送它回去。

在上述所有步骤中,一个值得注意的细节是,尽管BFG可以删除文件或文本,但它不会修改你的最新提交,这意味着如果敏感数据存在于你最近的提交之中,你需要手动删除,在这之后再运行BFG。

通过使用BFG Repo-Cleaner,你可以确保你的Git历史记录自由于敏感数据,而不需要为手动清理每一个提交而烦恼。不仅如此,BFG的效率极高,对于大型的存储库和长期的提交历史,其表现出色,即使在处理数万个提交和GB级别的数据时,也能快速和有效的清理Git历史。

目录
相关文章
|
2月前
|
人工智能 前端开发 Java
用git rebase命令合并开发阶段中多条commit提交记录
通过 `git rebase`,可以合并多个提交记录,使开发历史更简洁清晰。操作分为 6 步:查看提交历史 (`git log --oneline`)、设置需合并的提交数 (`git rebase -i HEAD~N`)、修改动作标识为 `s`(squash)、保存退出编辑、调整提交信息、强制推送至远程仓库 (`git push -f`)。此方法适合清理本地无关提交,但若有团队协作或冲突风险,需谨慎使用以避免问题。
124 60
|
1月前
|
Linux 开发工具 git
版本控制工具:Git的安装和基本命令使用指南。
结束这段探险,掌握了Git你就等于掌握了一个宝藏,随时可以瞥见你的编程历程,轻松面对日后的挑战。Git,无疑是编程者的强大武器,开始你的Git探险之旅吧!
95 28
|
6月前
|
开发工具 git
git 常用命令
这些只是 Git 命令的一部分,Git 还有许多其他命令和选项,可根据具体需求进行深入学习和使用。熟练掌握这些命令能够帮助你更高效地管理代码版本和协作开发。
|
4月前
|
网络安全 开发工具 git
mac git clone命令提示git@gitee.com: Permission denied (publickey).问题修复
mac git clone命令拉取gitee上项目代码时提示密钥问题
|
4月前
|
Java 网络安全 开发工具
Git进阶笔记系列(01)Git核心架构原理 | 常用命令实战集合
通过本文,读者可以深入了解Git的核心概念和实际操作技巧,提升版本管理能力。
|
5月前
|
机器学习/深度学习 Shell 网络安全
【Git】Git 命令参考手册
Git 命令参考手册的扩展部分,包含了从基础操作到高级功能的全面讲解。
125 3
|
6月前
|
缓存 Java Shell
[Git]入门及其常用命令
本文介绍了 Git 的基本概念和常用命令,包括配置、分支管理、日志查看、版本回退等。特别讲解了如何部分拉取代码、暂存代码、删除日志等特殊需求的操作。通过实例和图解,帮助读者更好地理解和使用 Git。文章强调了 Git 的细节和注意事项,适合初学者和有一定基础的开发者参考。
134 1
[Git]入门及其常用命令
|
7月前
|
开发工具 git
git学习四:常用命令总结,包括创建基本命令,分支操作,合并命令,压缩命令,回溯历史命令,拉取命令
这篇文章是关于Git常用命令的总结,包括初始化配置、基本提交、分支操作、合并、压缩历史、推送和拉取远程仓库等操作的详细说明。
222 1
git学习四:常用命令总结,包括创建基本命令,分支操作,合并命令,压缩命令,回溯历史命令,拉取命令
|
6月前
|
开发工具 git 开发者
|
6月前
|
开发工具 git 开发者
提升Git效率:掌握这5个高级命令
【10月更文挑战第17天】
121 0