OSS回源的几种方式和应用场景

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介: 原作者:阿里云解决方案架构师,韩虎。OSS回源有多种方式,选择哪种方式最合适,尤其是对于建立了混合云模式的大客户,怎样通过专线回源,是本文试图解决的问题。

OSS回源方式

OSS伪源服务:伪源服务是OSS团队开发的一款SaaS形态的文件上传OSS的工具,需使用SLB、ECS、RDS资源进行部署,可支持经典网络和VPC网络,支持上传请求鉴权和上传文件MD5校验,已有多个大客户在使用。

OSS镜像回源:使用镜像方式配置回源规则,当请求在OSS没有找到文件,会自动到源站抓取对应文件保存到OSS,并将内容直接返回到用户。

OSS重定向方式回源:使用重定向方式配置回源规则,满足响应条件的请求,会通过HTTP重定向的方式返回重定向的地址,然后浏览器或客户端再到源站获取内容。

镜像回源模式一:公网链路

0fdd569571d20e83a88852ea4691baca7e9ca889

解读:CDN回源到OSS,OSS在Bucket没找到文件,OSS走Internet链路按照配置的源站地址直接到客户源站回源取文件。

适合场景:适合大部分源文件在OSS,少量文件在客户源站,比如平滑迁移源站场景(会有少量文件继续写到客户源站)。

镜像回源模式二:专线链路

45526662f8b747dd57487d1a0db02f660a1671c1

解读:OSS直接透过客户VPC将回源请求通过高通专线透传到客户源站进行源文件抓取。

云平台安全方不允许此种回源方案,因为相当于OSS可以访问云下地址,如果客户更改成恶意源站地址,会对云平台造成安全风险,此前有过案例,除非OSS回源时可以对客户做鉴权。

镜像回源模式三:专线+Proxy

dad4f8f834ced524475a37bc5b48e52e85f8e342

解读:OSS回源请求通过Internet公网先回源到公网SLB,然后再在VPC ECS上部署Nginx将回源请求通过高通专线透传到源站。

适合场景:希望OSS镜像回源功能能够走专线,以保证回源稳定性和效率。

OSS内容同步方案:专线+伪源

6f1f9d3e97a682c5c91f4b7c312528be08790814

解读:在VPC中部署伪源服务,客户侧调用伪源服务接口发起源文件上传请求,伪源调用接口按指定URL抓取文件并上传到OSS。

适合场景:大量源文件走专线进行主动OSS上传,并可进行文件MD5校验后再上传OSS Bucket。

OSS内容同步-专线+伪源+镜像回源

f9ee0e33d0e91f0d757d11336eb4d0ff6103c095

解读:先使用伪源服务走专线进行大部分源文件预上传,然后再使用OSS镜像回源功能走公网或专线回源拉取少部分文件。

方案对比

9330f83de4a41a54046959de19d2c19e22507e6e

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
目录
相关文章
|
8月前
|
监控 Serverless 测试技术
Serverless 应用引擎常见问题之生成的图片的oss地址配成自定义的域名如何解决
Serverless 应用引擎(Serverless Application Engine, SAE)是一种完全托管的应用平台,它允许开发者无需管理服务器即可构建和部署应用。以下是Serverless 应用引擎使用过程中的一些常见问题及其答案的汇总:
104 0
|
1月前
|
存储 人工智能 开发工具
AI场景下的对象存储OSS数据管理实践
本文介绍了对象存储(OSS)在AI业务中的应用与实践。内容涵盖四个方面:1) 对象存储作为AI数据基石,因其低成本和高弹性成为云上数据存储首选;2) AI场景下的对象存储实践方案,包括数据获取、预处理、训练及推理阶段的具体使用方法;3) 国内主要区域的默认吞吐量提升至100Gbps,优化了大数据量下的带宽需求;4) 常用工具介绍,如OSSutil、ossfs、Python SDK等,帮助用户高效管理数据。重点讲解了OSS在AI训练和推理中的性能优化措施,以及不同工具的特点和应用场景。
96 10
|
1月前
|
弹性计算 人工智能 数据管理
AI场景下的对象存储OSS数据管理实践
本文介绍了ECS和OSS的操作流程,分为两大部分。第一部分详细讲解了ECS的登录、密码重置、安全组设置及OSSUTIL工具的安装与配置,通过实验创建并管理存储桶,上传下载文件,确保资源及时释放。第二部分则聚焦于OSSFS工具的应用,演示如何将对象存储挂载为磁盘,进行大文件加载与模型训练,强调环境搭建(如Conda环境)及依赖安装步骤,确保实验结束后正确清理AccessKey和相关资源。整个过程注重操作细节与安全性,帮助用户高效利用云资源完成实验任务。
93 10
|
11天前
|
存储 人工智能 数据管理
云端问道17期方案教学-AI场景下的对象存储OSS数据管理实践
本文介绍了AI场景下的对象存储OSS数据管理实践,由阿里云技术专家明锦分享。主要内容分为两部分:1) AI场景下对象存储实践方案,包括对象存储的应用、优势及在模型推理中的优化;2) OSS常用工具介绍,如OSSFS、Python SDK、Go SDK等,并详细说明了这些工具的特点和使用场景。文中还探讨了不同模式下的性能优化,以及即将推出的OS Connector for AI/ML工具,旨在提升数据下载速度和IO性能。
|
4月前
|
Java 对象存储 开发者
故障隔离与容错处理:Hystrix在Spring Cloud和Netflix OSS中的应用
故障隔离与容错处理:Hystrix在Spring Cloud和Netflix OSS中的应用
71 3
|
6月前
|
前端开发 对象存储
oss的断点续传在react中的应用
使用阿里云OSS的`multipartUpload`可自动管理文件切片与断点续传吗?测试时,上传一半中断(如刷新页面或重启浏览器),再续应从断点处继续。
108 10
|
7月前
|
运维 Serverless 应用服务中间件
Serverless 应用引擎产品使用合集之关于OSS映射目录的大小限制,如何可以跳过
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
Serverless 应用引擎产品使用合集之关于OSS映射目录的大小限制,如何可以跳过
|
5月前
|
NoSQL Serverless API
Serverless 架构实现弹幕场景问题之API Gateway和OSS域名未绑定成功的问题如何解决
Serverless 架构实现弹幕场景问题之API Gateway和OSS域名未绑定成功的问题如何解决
48 0
|
8月前
|
SQL 分布式计算 监控
基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
本文演示了使用 EMR Serverless Spark 产品搭建一个日志分析应用的全流程,包括数据开发和生产调度以及交互式查询等场景。
56627 7
基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
|
7月前
|
监控 Serverless 持续交付
阿里云云效产品使用问题之如何让流水线支持构建 flutter web 应用到 OSS
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。

热门文章

最新文章