一站式极致读吞吐,加速业务数字化转型 - 阿里云对象存储 OSS加速器解析与实践

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,内容安全 1000次 1年
云备份 Cloud Backup,100GB 3个月
简介: 阿里云对象存储OSS重磅推出OSS加速器功能,提供高性能、高吞吐量的数据访问服务。

OSS加速器介绍

   对象存储OSS(Object Storage Service)具有海量、可靠、安全、高性能、低成本的特点。OSS提供标准、低频、归档、冷归档类型,覆盖多种数据从热到冷的存储需求,单个文件的大小从1字节到48.8TB,可以存储的文件个数无限制。OSS已成为互联网、企业级数据应用的基础设施。

   然而,随着互联网业务的发展,越来越多的业务对数据的吞吐提出了更高的要求。为此,阿里云对象存储OSS重磅推出OSS加速器功能,它可以缓存OSS中的热点对象,提供高性能、高吞吐量的数据访问服务。

   OSS加速器适用于基因训练、机器学习、数据湖大数据计算等需要大带宽,且数据重复读较多的场景。OSS加速器是一个标准的服务端缓存服务,和计算完全解耦,不同于传统的OSS功能,其为AZ级的服务模式,用户可以在相关AZ创建加速器,计算引擎通过缓存加速域名进行数据读写。在典型的一些数据湖场景中,例如大数据计算(EMR/DLA等) + OSS场景中,数据读取要求的带宽可能高达数百Gbps~Tbps,普通存储空间的吞吐能力往往无法轻松应对这种大带宽的读取需求。这时您可以开启OSS加速器,将需要重复读取的数据缓存在加速中。当上层应用向OSS加速器请求数据时,加速器根据您购买的加速器的容量大小提供1.6Gbps/TB的带宽(或200MBps/TB的吞吐)和一定的回源带宽(回源带宽是指首次访问不存在于加速器中的数据时,从OSS读取原始数据的带宽,然后OSS会将该数据缓存到加速器中)。

   下图是数据访问流程:

ffa4b588caad4c31bedfb67081bd7015.png

OSS加速器技术特点

1) 极致吞吐能力
   OSS加速器有效解决多种应用场景(比如数据湖等)的读吞吐的挑战,特别是重复读的场景,其能够每TB提供200MBps(Byte)的吞吐能力,线性扩展,最高可以交付Tbps的带宽交付能力。
2)弹性伸缩
   通常计算任务有周期性需求,如何有效避免资源浪费,提效降本?通过OSS加速器的弹性伸缩能力,能够在线进行扩容缩容,可以按需释放或提升资源,有效降低TCO。
3)存算分离
   OSS加速器满足计算资源和存储资源解耦,面对计算任务的多样化,不再需要多个自建缓存搭建匹配,存算分离,灵活选择引擎和版本,满足多业务场景的吞吐加速。
4)数据一致
   同时,基于OSS智能元数据架构,OSS加速器提供了传统缓存方案不具备的一致性,当OSS上文件被更新时,加速器能自动识别,确保引擎读取到的都是最新数据。

使用示例

   下面将演示如何创建OSS加速器以及使用OSS加速器的实际效果。

创建OSS加速器

   用户可以在OSS控制台主页面左侧的导航栏下方看到"OSS加速器"标签页,申请试用通过后,可以看到OSS加速器功能界面

7ae0c59939694f01a0c24c420f7f2d66.png

   点击“创建OSS加速器”按钮后我们可以创建OSS加速器,这个时候会弹出"创建OSS加速器"对话框

f385b1d96aa241cb9590b6bc22b661bd.png

   您可以设置加速器的名称和容量,目前加速器的容量是20TB起步,最高可以设置100TB(更高的容量需要开工单进行申请),容量步长为5TB。目前OSS加速器支持的的可用区是上海的cn-shanghai-g可用区,其他的可用区正在逐步开放中。

修改加速器容量

   创建好加速器后,我们还可以修改加速器的容量,修改加速器的容量同样会修改相关的带宽(吞吐)指标(这里显示的是MB/s,可以自行折算成Mbps或Gbps)。

19d97f1da5614a1587a9b876234adca4.png

设置加速路径

   创建好加速器后,我们需要设置加速路径(加速路径是指当访问对象的前缀匹配加速路径时,会访问加速器进行加速数据访问)。

550351cedfb6488c869304bdf78a1eec.png

   目前一个加速器可以可以配置的bucket数量无限制,每个bucket可以配置最多10个加速路径(如果不设置加速路径的话,将会加速整个bucket里面的数据读取)。

效果展示

   下面我们展示一下加速容量从40TB提升到100TB,然后再降为70TB的效果图(图上的带宽吞吐单位是Byte/s,读取的对象之前访问过,已经缓存在加速器中)。

65c455c7f7f3496c9d2dfe125af6c50a.png

   40TB的加速器容量对应的读带宽约是62.5Gbps,当我们将加速器容量提升到100TB时,带宽上升到约156.25Gbps,然后我们将加速器容量降低到70TB,我们可以看到带宽降到约109.375Gbps。可见OSS加速器可以很好地实现读吞吐带宽的按需提升,弹性伸缩,满足相关业务的需求。

试用申请

   目前阿里云对象存储OSS加速器在邀测使用中,阿里云企业认证用户可申请试用,点击立即申请

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
目录
相关文章
|
2月前
|
机器学习/深度学习 人工智能 专有云
人工智能平台PAI使用问题之怎么将DLC的数据写入到另一个阿里云主账号的OSS中
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
1月前
|
存储 机器学习/深度学习 弹性计算
阿里云EMR数据湖文件系统问题之OSS-HDFS全托管服务的问题如何解决
阿里云EMR数据湖文件系统问题之OSS-HDFS全托管服务的问题如何解决
|
2月前
|
分布式计算 DataWorks 调度
DataWorks产品使用合集之多个业务流程上传同名资源到同一个OSS(对象存储服务)URL,会产生什么问题
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
2月前
|
消息中间件 分布式计算 DataWorks
DataWorks产品使用合集之如何使用Python和阿里云SDK读取OSS中的文件
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
2月前
|
DataWorks 安全 定位技术
DataWorks产品使用合集之如何同步OSS中的Parquet数据,并解析里面的数组成多个字段
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
2月前
|
存储 运维 安全
阿里云OSS的优势
【7月更文挑战第19天】阿里云OSS的优势
103 2
|
2月前
|
存储 API 开发工具
阿里云OSS
【7月更文挑战第19天】阿里云OSS
89 1
|
2月前
|
人工智能 对象存储
【阿里云AI助理】自家产品提供错误答案。阿里云OSS 资源包类型: 下行流量 地域: 中国内地通用 下行流量包规格: 300 GB 套餐: 下行流量包(中国内地) ,包1年。那么这个是每月300GB,1年是3600GB的流量;还是1年只有300GB的流量?
自家产品提供错误答案。阿里云OSS 资源包类型: 下行流量 地域: 中国内地通用 下行流量包规格: 300 GB 套餐: 下行流量包(中国内地) ,包1年。那么这个是每月300GB,1年是3600GB的流量;还是1年只有300GB的流量?
108 1
|
2月前
|
存储 弹性计算 对象存储
预留空间是什么?阿里云OSS对象存储预留空间说明
阿里云OSS预留空间是预付费存储产品,提供折扣价以锁定特定容量,适用于抵扣有地域属性的Bucket标准存储费用及ECS快照费。通过购买预留空间,如500GB通用预留+100GB标准-本地冗余存储包,用户可优化成本。
|
2月前
|
运维 Serverless 数据处理
函数计算产品使用问题之在对象存储服务(OSS)上创建ZIP包解压触发器后,触发器未按预期执行,一般是什么导致的
函数计算产品作为一种事件驱动的全托管计算服务,让用户能够专注于业务逻辑的编写,而无需关心底层服务器的管理与运维。你可以有效地利用函数计算产品来支撑各类应用场景,从简单的数据处理到复杂的业务逻辑,实现快速、高效、低成本的云上部署与运维。以下是一些关于使用函数计算产品的合集和要点,帮助你更好地理解和应用这一服务。

相关产品

  • 对象存储
  • 推荐镜像

    更多