阿里云云存储网关(CSG)软件版顺序写模式使用教程

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介: 阿里云云存储网关(CSG)软件版是一款安装在阿里云用户机器上的云存储网关产品。本文介绍了如何使用CSG软件版的特殊工作模式——顺序写模式,以及相关注意事项。

背景

阿里云云存储网关(Cloud Storage Gateway, CSG)软件版(以下简称CSG软件版)是一款可以安装在阿里云用户机器(ECS,或用户自建机房服务器)上的云存储网关产品。使用CSG软件版可以实现将OSS Bucket挂载到用户机器,以POSIX文件系统接口进行访问。


目前CSG软件版同时支持Linux系统和Windows系统。


对于备份上云的场景,通常需要将文件完整上传到OSS中,这个过程会将文件从头到尾按顺序进行传输。我们将这种数据的写入模式称为顺序写模式。在顺序写的场景下,CSG软件版根据这种写入模式的特点,使用内存作为缓冲区,避免磁盘写入的性能瓶颈,充分利用网络带宽进行文件上云


顺序写模式与标准模式的对比


标准模式

顺序写模式

缓存磁盘

需要

不需要数据缓存部分,仅需要元数据部分

内存

多,该模式使用内存进行传输加速,内存使用和使用方法有关,需要合理评估内存使用量

写入性能

受限于磁盘带宽

受限于网络带宽,顺序写入的业务负载在该模式下远高于标准模式

读取性能

已经缓存在磁盘中的数据读取比较快

单流自带预取策略,并发场景受限于磁盘带宽

无本地缓存

单流受限于OSS性能,高并发下可充分利用带宽

随机和覆盖写

支持

不支持,覆盖写入同名文件需要先删除老文件

文件上云模式

异步上云,挂载点写入成功后触发上传

同步上云,挂载点写入成功后OSS立即可见

创建文件夹(mkdir)

支持

支持

重命名(mv)

支持

支持,同步串行进行OSS文件Copy,文件过大耗时较长。

修改文件属性操作(chmod)

支持

不支持,请求不报错但不生效

软链接(symlink)

支持

不支持

根据上述对比表格可以发现,CSG软件版顺序写模式是针对文件纯上云场景下的特殊优化版本,在纯顺序写场景下可以充分发挥机器的网络带宽,高效上云。下面对CSG软件版顺序写模式的使用方式做进一步介绍。

前提条件

  • 已注册阿里云账号,并完成实名认证。
  • 已开通云存储网关服务。
  • 已有可用的Linux客户端机器,目前支持的操作系统为:CentOS 7、Alibaba Cloud Linux 2。
  • 线上CSG软件版:在创建CSG软件版的地域,已有可用的阿里云服务器ECS作为客户端机器。
  • 线下CSG软件版:要求机器可以访问公网或者通过阿里云专线等方式接入阿里云VPC。
  • 已创建OSS Bucket,且OSS Bucket的地域应当与客户端机器的地域保持一致。
  • 已创建阿里云AccessKey信息。


具体可以参考:https://help.aliyun.com/document_detail/286329.html

使用步骤

步骤一:下载安装包

当前最新版本:0.6.1。

Linux操作系统

下载链接:

Windows操作系统

下载链接:

Windows Server 2016、Windows Server 2019:CsgAgent-latest-win64.zip


下面以centos7版本进行举例。

步骤二:安装

从官网下载安装包CsgAgent-latest-centos7.rpm至客户端。

执行下列命令进行安装:

sudo rpm -i CsgAgent-latest-centos7.rpm
sudo /usr/local/bin/Aliyun/csg/scripts/install.sh

可以执行命令csgfsctl --help查看云存储网关软件版安装情况。

步骤三:激活

云存储网关软件版安装完成后,需要对其进行激活才能正常使用。使用前,您需要获得自己AccessKey(ak)和AccessKey Secret(sk)信息。如果是您是RAM用户,则需要具备AliyunHCSSGWFullAccess 权限。

  • 线上CSG软件版:执行命令行 csgfsctl activate --ak=xxx --sk=xxx 进行激活。
  • 线下CSG软件版:执行命令行 csgfsctl activate --region=xxx --ak=xxx --sk=xxx 进行激活。其中,region只能填写CSG软件版控制台支持的地域,以杭州地域为例,region为cn-hangzhou。


激活完成之后,您可以登录CSG软件版控制台,选择对应的地域,即可以查看到对应的CSG软件版客户端信息。

步骤四:创建顺序写模式挂载点

以一个在杭州地域的阿里云ECS客户端上创建挂载点为例。使用的OSS Bucket名称为gw1-test,工作模式为seq-write,数据缓存大小为20GB,在顺序写模式下不会占用数据缓存的空间,CSG软件版支持顺序写模式与标准模式进行切换,配置中的20GB为给标准模式预留。

csgfsctl create --mp=/mnt/test --cd=/root/cache --ak=xxx --sk=xxx --ep=oss-cn-hangzhou-internal.aliyuncs.com --bucket=gw1-test --dc=20-c=30--work-mode=seq-write

创建成功使用csgfsctl get可以看到对应的挂载点。

image.png

简单测试

测试一:复制本地文件到挂载点

  1. 创建一个seq-demo的测试文件夹。

image.png

  1. 将安装包copy到测试目录下:

image.png

在OSS控制台可以看到文件的mtime与本地一致,表明文件同步上云没有延迟。

image.png

测试二:使用dd命令测试文件写入速度

dd if=/dev/zero of=/mnt/test/seq-demo/file bs=1M count=1024oflag=direct status=progress

image.png

带宽性能和机器规格有关,可以看到单路文件的上传已经超过了普通高效云盘的带宽。

测试三:覆盖写文件

  1. 尝试二次cp安装包到测试目录,覆盖写入被拒绝。

image.png

  1. 将老文件重命名为xxx.old,再次进行cp,成功。

image.png

内存使用评估方法

顺序写模式的内存使用和写入的并发程度相关,每个文件的在写入时会分配临时的内存缓冲区,在0.6.1版本及以前默认为20MB*2的内存,即单文件写入需要40MB内存占用,当文件关闭后对应缓冲区自动释放。当同时写入10个文件时,则需要占用40MB*10=400MB的内存空间,每个挂载点本身也需要预留约512MB的内存空间作为文件上传缓冲。

请根据自己的机器规格合理的安排同时写入的文件的个数,在顺序写入的模式下,由于CSG软件版往OSS上传数据也是多线程进行的,串行写入文件也可以获得比较好的性能,建议同时写入的文件不要超过4个。

另外,支持写入的文件大小与缓冲区大小有关,默认支持小于20MB*10000=200GB文件上传。若遇到需要支持更大文件上传的情况时,请联系阿里云售后支持。

相关实践学习
1分钟 Serverless搭建高性能网盘
本场景将使用阿里云函数计算、文件存储NAS以及开源项目Kodbox,带大家1分钟Serverless搭建个人高性能网盘,网盘可长期使用。
相关文章
|
1月前
|
域名解析 移动开发 负载均衡
阿里云DNS常见问题之DNS负载均衡调加权模式失败如何解决
阿里云DNS(Domain Name System)服务是一个高可用和可扩展的云端DNS服务,用于将域名转换为IP地址,从而让用户能够通过域名访问云端资源。以下是一些关于阿里云DNS服务的常见问题合集:
|
2月前
|
弹性计算 安全 数据库
2024年阿里云优惠券领取及使用教程
2024年阿里云优惠券领取及使用教程
397 0
|
25天前
|
弹性计算 关系型数据库 MySQL
阿里云数据库服务器价格表,数据库创建、连接和使用教程
阿里云数据库使用流程包括购买和管理。选择所需数据库类型如MySQL,完成实名认证后购买,配置CPU、内存和存储。确保数据库地域与ECS相同以允许内网连接。创建数据库和账号,设置权限。通过DMS登录数据库,使用账号密码连接。同一VPC内的ECS需添加至白名单以进行内网通信。参考官方文档进行详细操作。
126 3
|
1月前
|
弹性计算 关系型数据库 MySQL
阿里云MySQL云数据库优惠价格、购买和使用教程分享!
阿里云数据库使用流程包括购买和管理。首先,选购支持MySQL、SQL Server、PostgreSQL等的RDS实例,如选择2核2GB的MySQL,设定地域和可用区。购买后,等待实例创建。接着,创建数据库和账号,设置DB名称、字符集及账号权限。最后,通过DMS登录数据库,填写账号和密码。若ECS在同一地域和VPC内,可内网连接,记得将ECS IP加入白名单。
443 2
|
1月前
|
SQL 关系型数据库 MySQL
阿里云mysql数据库价格购买和使用教程
阿里云数据库使用指南:购买MySQL、SQL Server等RDS实例,通过选择配置、地域和可用区完成购买。创建数据库和账号,分配权限。使用DMS登录数据库,进行管理操作。确保ECS与RDS在同一地域的VPC内,配置白名单实现内网连接。详细步骤见官方文档。
632 1
|
1月前
|
存储 弹性计算 数据库
阿里云优惠券是什么?2024年阿里云优惠券领取地址及使用教程汇总
阿里云作为国内领先的云计算服务提供商,为广大用户提供了丰富的云产品和解决方案。为了吸引用户上云,阿里云经常推出各种优惠活动,其中最受用户欢迎的就是阿里云优惠券。那么,阿里云优惠券究竟是什么呢?我们又该如何领取它呢?本文将为大家详细解答。
229 2
|
1月前
|
存储 弹性计算 数据库
2024年阿里云优惠券领取、使用教程及常见问题整理总结
随着云计算技术的不断发展,越来越多的企业和个人选择将业务迁移到云端。阿里云作为国内领先的云服务提供商,为用户提供了丰富的产品和服务。为了帮助用户降低成本,阿里云推出了优惠券活动,本文将为大家介绍阿里云优惠券的领取、使用方法以及常见问题解答。
188 0
|
1月前
|
存储 弹性计算 数据库
2024年阿里云优惠券领取和使用教程分享(图文教程)
2024年阿里云优惠券怎么领取?为了助力更多用户优惠上云,也为了让更多用户选择阿里云的云产品完成上云,阿里云公司针对新用户推出了满减优惠券,这款抵扣优惠券也就是大家俗称的满减抵扣券,自领取日30天起内有效。领取和使用优惠券是很多新手用户上云的必领福利,本文为各位新手用户介绍下2024年阿里云优惠券的领取和使用教程。
136 0
|
2月前
|
弹性计算
阿里云服务器“带宽计费模式”详细说明_2024固定带宽和流量详解
阿里云服务器“带宽计费模式”详细说明_2024固定带宽和流量详解,按固定带宽是指直接购买多少M带宽,比如1M、5M、10M、100M等,阿里云直接分配用户所购买的带宽值,根据带宽大小先付费再使用;按使用流量是先设置一个带宽峰值,然后根据实际公网产生的出流量来计算费用,先使用后付费
|
2月前
|
弹性计算
阿里云服务器的带宽计费模式是什么意思?咋收费的?
阿里云服务器带宽计费模式分为“按固定带宽”和“按使用流量”,有什么区别?按固定带宽是指直接购买多少M带宽,比如1M、5M、10M、100M等,阿里云直接分配用户所购买的带宽值,根据带宽大小先付费再使用;按使用流量是先设置一个带宽峰值,然后根据实际公网产生的出流量来计算费用,先使用后付费。阿里云百科分享阿里云服务器“带宽计费模式”详细区别、计费及注意事项

热门文章

最新文章