【最佳实践】如何通过OSSimport工具将线下数据迁移至金融云OSS?

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储OSS,敏感数据保护2.0 200GB 1年
文件存储 NAS,50GB 3个月
简介: 1. 当前存在的问题: 金融云由于等保要求,不能直接将闪电立方设备寄送到金融云机房。因此,我们还不能通过闪电立方的方式直接迁移数据至金融云OSS。但是金融云提供了另外一种类型的Bucket-金融云公网Bucket。

1. 当前存在的问题:

金融云由于等保要求,不能直接将闪电立方设备寄送到金融云机房。因此,我们还不能通过闪电立方的方式直接迁移数据至金融云OSS。但是金融云提供了另外一种类型的Bucket-金融云公网Bucket。金融云公网Bucket类似于公共云,能够被互联网直接访问。因此,是否可以借助于金融云公网OSS进行中转?

2.总体思路:

由于金融云内网只能在金融云内部访问。外部互联网无法访问。但是金融云公网Bucket类似于与公共云的OSS,允许VPC以及经典网络以及互联网访问。因此我们的思路是在金融云内部搭建1个ECS服务。该ECS服务是能够访问金融云内网Bucket,同时该ECS也是能够访问金融云公网OSS。
注意:金融云的ECS可以直接访问互联网,但是互联网的end user是不能直接访问金融云内部ECS的。需要通过SLB中转。

此处我们的思路是这样的:

  • 创建金融云ECS,同时创建金融云内网OSS;
  • 在该金融云ECS上部署ossimport工具,通过ossimport工具将金融云公网Bucket内容 迁移至 金融云内网Bucket;

说明:

  1. 测试环境下:该方式的单台ECS迁移速度可以达到50MB/s;
  2. 若实际测试环境速度达不到客户要求,可以创建多个ECS服务器,然后集群版ossimport,
  3. 说明:整个迁移过程都不走公网,不会产生流量费用!!!

3.演示示例:

如下的示例均是基于这个场景,实际配置过程中请根据实际客户场景进行修改;

•    ECS 服务器:ubuntu16.04
    - ECS endpoint: 华东2金融云
•    金融云内网OSS: (目的端)
    - Bucket名称:test-shagnhai-finane-in
    - Endpoint: oss-cn-shanghai-finance-1-internal.aliyuncs.com
•    金融云公网OSS:(源端)
    - Bucket 名称:test-shanghai-finance-pubb
    - 内网Endpoint:oss-cn-shanghai-finance-1-pub-internal.aliyuncs.com
    - 外网Endpoint:oss-cn-shanghai-finance-1-pub.aliyuncs.com

3.1 Step1:在上海金融云开通部署ECS

1.下载ossimport(此处下载ossimport集群版):

a) 命令:wget http://gosspublic.alicdn.com/ossimport/distributed/ossimport-2.3.2.tar.gz?spm=a2c4g.11186623.2.1.9EPlFR&file=ossimport-2.3.2.tar.gz
b) 解压 ossimport;tar -zxvf ossimport-2.3.2.tar.gz
c) 修改 worker,job.cfg以及sys.properties文件。
d) 注意worker中 master的ip写在第一行
e) 详细安装部署请参考:https://help.aliyun.com/document_detail/56990.html?spm=a2c4g.11186623.6.1109.d6a1pD

3.2Step2:安装ossimport

1.安装示例:安装示例

安装说明:安装过程中有可能提示任务无法执行,那是因为默认ubuntu没有安装java,请手工安装default-jre;
Job.cfg文件配置:源与目的endpoint 均请填写内网二级域名(注意,不要写外网域名!!!!

3.3Step3: 在master节点上运行

1. 在master运行: bash console.sh deploy
2. 提交任务: bash console.sh submit
3. 启动服务:Linux终端执行 bash console.start
4. 查看任务状态: bash console.sh stat
相关实践学习
通义万相文本绘图与人像美化
本解决方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。
相关文章
|
1月前
|
存储 监控 调度
如何在阿里云OSS之间进行数据迁移呢?
讲解如何在阿里云对象存储OSS之间进行跨账号、跨地域、以及同地域内的数据迁移,包括数据迁移之前的准备工作和实施数据迁移以及一些后续操作,使用在线迁移服务,您可以将第三方数据轻松迁移至阿里云对象存储OSS,也可以在对象存储OSS之间进行灵活的数据迁移。
|
1月前
|
存储 安全 数据处理
阿里云OSS如何支持大规模数据迁移和传输?
阿里云OSS凭借全球基础设施、无限扩展、高持久性、成本优化及安全防护等优势,成为企业大规模数据迁移与传输的首选。其支持智能分层存储、高速传输及多场景数据处理,提供端到端解决方案,助力企业高效构建全球化数据管道,实现数据价值最大化。
|
3月前
|
存储 缓存 分布式计算
OSS大数据分析集成:MaxCompute直读OSS外部表优化查询性能(减少数据迁移的ETL成本)
MaxCompute直读OSS外部表优化方案,解决传统ETL架构中数据同步延迟高、传输成本大、维护复杂等问题。通过存储格式优化(ORC/Parquet)、分区剪枝、谓词下推与元数据缓存等技术,显著提升查询性能并降低成本。结合冷热数据分层与并发控制策略,实现高效数据分析。
|
3月前
|
存储 运维 分布式计算
OSS迁移实战:从自建MinIO到阿里云OSS的完整数据迁移方案
本文介绍了从自建MinIO迁移至阿里云OSS的完整方案,涵盖成本优化、稳定性提升与生态集成需求。通过双写代理、增量同步、分层校验等技术,解决数据一致性、权限迁移、海量小文件处理等挑战,实现业务零中断与数据强一致性,最终达成79%的TCO降低和显著性能提升。
928 0
|
6月前
|
存储 消息中间件 运维
AutoMQ x OSS 的 Iceberg 数据入湖的最佳实践
本文将从三个维度展开论述:首先分析 Iceberg 的技术优势及其成为行业标准的原因,其次详细阐述数据入湖的最佳实践方法,最后重点介绍 AutoMQ 如何利用阿里云 OSS 高效解决 Kafka 数据入湖问题。通过 AutoMQ 和阿里云服务的结合,用户可以轻松实现 Kafka 数据入湖的最佳实践。
456 15
|
6月前
|
存储 消息中间件 Kafka
AutoMQ x OSS 的 Iceberg 数据入湖的最佳实践
在数据湖技术生态中,Apache Iceberg凭借其开放性设计已确立事实标准地位。该技术不仅获得全球企业广泛采用,还构建了包含Apache Spark、Amazon Athena、Presto等主流计算引擎的完整生态系统。
|
11月前
|
监控 Java 对象存储
监控与追踪:如何利用Spring Cloud Sleuth和Netflix OSS工具进行微服务调试
监控与追踪:如何利用Spring Cloud Sleuth和Netflix OSS工具进行微服务调试
172 1
|
负载均衡 Java 对象存储
负载均衡策略:Spring Cloud与Netflix OSS的最佳实践
负载均衡策略:Spring Cloud与Netflix OSS的最佳实践
165 2
|
存储 JSON 自然语言处理
OSS数据源一站式RAG最佳实践
本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。
7454 11
|
运维 Java Serverless
Serverless 应用引擎产品使用合集之是否提供工具来给OSS配置HTTPS证书
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。

相关产品

  • 对象存储