阿里云oss同步文件到本地,添加宝塔定时任务自动同步

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介: 阿里云oss同步文件到本地,添加宝塔定时任务自动同步

博客储存桶换到了又拍云,由于部署原因,云储存只是方便利用插件快速上传,只做储存用。访问的源站是到本地的,故需要将云储存上的文件镜像到本地,但找了半圈又拍不支持将云储存增量同步到本地(但可以本地->到云储存),但是阿里云oss可以,所以借助又拍云的融合云储存将文件同步到阿里云oss,在借助阿里云oss的ossutil命令行工具将文件储存到本地。完成需求。

1.安装阿里云ossutil命令行工具

  1. wget https://gosspublic.alicdn.com/ossutil/1.7.9/ossutil64

2运行以下命令修改文件执行权限。

  1. chmod 755 ossutil64

3.生成配置文件

  1. ./ossutil64 config

4.根据提示设置工具的语言和配置

请输入语言CH或EN。工具使用的语言默认与操作系统保持一致。该配置项将在此次config命令设置成功后生效。

根据提示分别设置EndpointAccessKey IDAccessKey SecretSTSToken参数。

参数说明如下:

  • endpoint:填写Bucket所在地域的Endpoint。各地域Endpoint详情,请参见访问域名和数据中心。
  • accessKeyID、accessKeySecret:填写账号的AccessKey。
  • stsToken:使用STS临时授权账号访问OSS时需要配置该项,否则置空即可。

5.安装完成,同步阿里云oss文件到本地

命令

注意: 同步到本地的文件夹,路径请严格按格式配置,否则可能会同步到ossutil安装目录去

  1. ./ossutil64 sync oss://你的oss储存桶名称/localdir/ destdir/
  2. #翻译⬇️
  3. ./ossutil64 sync oss://你的oss储存桶名称/oss目录文件夹/ 同步到本地的目录/
  4. ./ossutil64 sync oss://你的oss储存桶名称/localdir/ -u --update /destdir/
  5. #翻译⬇️
  6. -u --update 表示:只有当目标文件不存在,或源文件的最后修改时间晚于目标文件时,ossutil才会执行同步操作。

命令格式

  1. ./ossutil64 sync cloud_url file_url
  2. [-f --force]
  3. [-u --update]
  4. [--maxdownspeed <value>]
  5. [--delete]
  6. [--backup-dir <value>]
  7. [--enable-symlink-dir]
  8. [--disable-all-symlink]
  9. [--disable-ignore-error]
  10. [--only-current-dir]
  11. [--output-dir <value>]
  12. [--bigfile-threshold <value>]
  13. [--part-size <value>]
  14. [--checkpoint-dir <value>]
  15. [--range <value>]
  16. [--encoding-type <value>]
  17. [--snapshot-path <value>]
  18. [--include <value>]
  19. [--exclude <value>]
  20. [--disable-crc64]
  21. [--payer <value>]
  22. [-j, --job <value>]
  23. [--parallel <value>]
  24. [--retry-times <value>]

参数及选项说明如下:

配置项 说明
cloud_url OSS文件夹(目录)路径。格式为oss://bucketname/path/。例如oss://examplebucket/exampledir/。如果输入的cloud_url没有以正斜线(/)结尾,ossutil会自动在结尾处添加一个正斜线(/)。
file_url 待同步的本地文件夹路径。例如Linux系统文件夹路径/localfolder/Windows系统文件夹路径D:\localfolder\
-f --force 强制操作,不进行询问提示。
-u,--update 只有当目标文件不存在,或源文件的最后修改时间晚于目标文件时,ossutil才会执行同步操作。
--maxdownspeed 最大下载速度,单位为KB/s,默认值为0,表示不限制下载速度。
--delete 将目的端指定路径下的其他文件都删除,仅保留本次同步的文件。

警告 建议您使用--delete选项前开启版本控制,防止数据被误删。

--backup-dir 指定目标文件夹,用于保存目的端存在而源端不存在的文件。
--enable-symlink-dir 同步链接子目录。
--disable-all-symlink 同步目录时,忽略所有的链接子文件以及链接子目录。
--disable-ignore-error 批量操作时不忽略错误。
--only-current-dir 仅同步当前目录下的文件,忽略子目录及子目录下的文件。
--output-dir 指定输出文件所在的目录。输出文件是指批量同步文件出错时产生的report文件,默认保存在当前目录下的ossutil_output目录。
-bigfile-threshold 设置断点续传文件的大小阈值,单位为字节。

默认值:100 MB

取值范围:0~9223372036854775807

--part-size 设置分片大小,单位为字节。默认情况下ossutil会根据文件大小自行计算合适的分片大小值。

取值范围:1~9223372036854775807

--checkpoint-dir 指定断点续传记录信息所在的目录。断点续传操作失败时,ossutil会自动创建名为.ossutil_checkpoint的目录,并在该目录下记录checkpoint信息,断点续传成功后会删除该目录。如果指定了该选项,请确保指定的目录可以被删除。
--range 下载目标文件的指定字段,并保存为一个新的文件,字段从0开始编号。
  • 指定区间例如指定为3-9,表示下载文件的第3个字节到第9个字节(包含第3和第9字节)。
  • 指定开始位置例如指定为3-,表示从第3个字节开始到文件结尾(包含第3个字节)。
  • 指定结束位置例如指定为-9,表示从0字节到第9个字节(包含第9个字节)。
--encoding-type 文件名称的编码方式。取值为url。如果不指定该选项,则表示文件名称未经过编码。
--snapshot-path 指定保存同步文件时的快照信息所在的目录。在下一次同步文件时,ossutil会读取指定目录下的快照信息进行增量同步。
--include 包含符合指定条件的所有文件。
--exclude 不包含任何符合指定条件的文件。
--disable-crc64 关闭CRC64数据校验。
--payer 请求的支付方式。如果希望访问指定路径下的资源产生的流量、请求次数等费用由请求者支付,请将此选项的值设置为requester
-j,--job 多文件操作时的并发任务数,默认值为3,取值范围为1~10000。
--parallel 单文件操作时的并发任务数,取值范围为1-10000。 如果不设置此选项,默认由ossutil根据操作类型和文件大小自行决定。
--retry-times 发生错误后的重试次数。默认值为10,取值范围为1~500。

网络异常,图片无法展示
|

6.设置宝塔定时任务 自动同步

参考命令:

  1. cd /www2/upx##先进入到ossutil工具目录
  2. ./ossutil64 sync oss://a-oss-zmki-cn/ -u --update /www2/wwwroot/a-oss.zmki.cn/

网络异常,图片无法展示
|

 

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
目录
相关文章
|
5月前
|
机器学习/深度学习 人工智能 专有云
人工智能平台PAI使用问题之怎么将DLC的数据写入到另一个阿里云主账号的OSS中
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
1月前
|
分布式计算 Java 开发工具
阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。
|
2月前
|
对象存储
一个通过 GitHub Action 将 GitHub 仓库与阿里云 OSS 完全同步的脚本
一种将 GitHub 仓库完全同步到阿里云 OSS 的方法。
|
4月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之上传素材文件不在同一地域的OSS,怎么上传多张图片
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
48 1
|
4月前
|
存储 机器学习/深度学习 弹性计算
阿里云EMR数据湖文件系统问题之OSS-HDFS全托管服务的问题如何解决
阿里云EMR数据湖文件系统问题之OSS-HDFS全托管服务的问题如何解决
|
4月前
|
存储 运维 Serverless
函数计算产品使用问题之OSS触发器是否可以只设置文件前缀
函数计算产品作为一种事件驱动的全托管计算服务,让用户能够专注于业务逻辑的编写,而无需关心底层服务器的管理与运维。你可以有效地利用函数计算产品来支撑各类应用场景,从简单的数据处理到复杂的业务逻辑,实现快速、高效、低成本的云上部署与运维。以下是一些关于使用函数计算产品的合集和要点,帮助你更好地理解和应用这一服务。
|
5月前
|
消息中间件 分布式计算 DataWorks
DataWorks产品使用合集之如何使用Python和阿里云SDK读取OSS中的文件
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
5月前
|
DataWorks 安全 定位技术
DataWorks产品使用合集之如何同步OSS中的Parquet数据,并解析里面的数组成多个字段
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
5月前
|
存储 运维 安全
阿里云OSS的优势
【7月更文挑战第19天】阿里云OSS的优势
216 2
|
5月前
|
存储 API 开发工具
阿里云OSS
【7月更文挑战第19天】阿里云OSS
198 1