modelscope使用git lfs 传数据集,总共62G,传到40多G又从0开始,如何解决呢?
在使用 ModelScope 上传数据集时,如果遇到通过 Git LFS 传输大文件(如 62G 数据集)过程中出现“传到 40 多 G 后又从 0 开始”的问题,可能是由于网络中断、Git LFS 配置不当或服务器端限制等原因导致的。以下是详细的解决方法和操作步骤:
ping
或其他工具测试与目标服务器的连接质量。git config lfs.concurrenttransfers 8
git config lfs.standalonetransferagent basic
说明:lfs.concurrenttransfers
参数控制并发上传的线程数,建议设置为 4~8 以提高效率。 - 增加超时时间:如果上传过程中因超时导致中断,可以增加超时时间:
git config lfs.activitytimeout 300
说明:lfs.activitytimeout
参数单位为秒,默认值为 300 秒,可根据需要适当延长。
git --version
git-lfs --version
sudo apt-get update
sudo apt-get install git git-lfs
重要提示:确保 Git 版本不低于 2.20,Git LFS 版本不低于 3.0。
git lfs logs last
说明:该命令会显示最近一次 LFS 操作的日志,帮助定位问题。 - 手动恢复上传:如果上传中断,可以尝试重新执行以下命令以恢复上传:
git push origin <branch-name>
注意:确保 .git/lfs/objects
目录未被删除或修改。
split -b 10G large_dataset.zip part_
说明:上述命令将 large_dataset.zip
拆分为多个 10G 的部分文件。 - 上传完成后,在服务器端合并文件:
cat part_* > large_dataset.zip
git lfs push --all origin
git lfs prune
通过以上步骤,您可以有效解决 Git LFS 上传大文件时“从 0 开始”的问题。如果问题仍未解决,建议联系 ModelScope 官方技术支持团队获取进一步帮助。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352