数据湖实操讲解【OSS 访问加速】第五讲:访问 OSS 这类对象存储最快的方式 - JindoFS SDK

简介: 数据湖 JindoFS+OSS 实操干货 36讲 每周二16点准时直播!扫文章底部二维码入钉群,线上准时观看~ Github链接: https://github.com/aliyun/alibabacloud-jindofs

本期导读 :【OSS 访问加速】第五讲


主题:访问OSS这类对象存储最快的方式- JindoFS SDK


讲师:诚历,阿里巴巴计算平台事业部 EMR 技术专家


内容框架:

  • 大数据存储架构演进
  • JindoFS
  • JindoFS SDK
  • JindoFS 性能


直播回放链接:(5/6讲)

https://developer.aliyun.com/live/246811



一、大数据存储架构演进


640 (26).png


数据湖存储方案(JindoFS SDK + 对象存储)

640.png


二、JindoFS


JindoFS 双模式

  • 既是一个分布式缓存系统,为计算加速和提供优化(缓存/cache 模式)
  • 也是一个分布式存储系统,支持高可靠高可用和安全(存储/block 模式)

640 (1).png


JindoFS 客户端Native 架构

  • 全链路Native
  • 一套底层适配多个场景

image.png


三、JindoFS SDK


HCFS 标准

  • Filesystem Compatibility with Apache Hadoop


JindoFS SDK 访问OSS

640 (2).png


详细使用介绍请参考后续的课程或


参考Github:https://github.com/aliyun/alibabacloud-jindofs



四、JindoFS SDK 优势


高性能

  • Native Object Engine 基础操作性能平均提升2.2倍
  • Jindo HCFS 对比开源版本性能大幅提升


易集成

  • 不引入额外Java 依赖,避免生产环境出现依赖冲突
  • 社区模式:文档完善+在线支持


高可靠

  • 大量客户Hadoop 生产环境部署使用
  • 对接引擎丰富


Jindo Native Object SDK vs OSS Java SDK

640 (3).png

Jindo OSS Hadoop SDK vs Hadoop 现有OSS SDK

640 (4).png


直接观看视频回放,获取实例讲解~https://developer.aliyun.com/live/246811



Github链接:

https://github.com/aliyun/alibabacloud-jindofs


不错过每次直播信息、探讨更多数据湖 JindoFS+OSS 相关技术问题,欢迎扫码加入钉钉交流群!

1835a71d3367446db32f7169e4ae62e3.jpg








相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
相关文章
|
5月前
|
存储 监控 文件存储
存储之外,还有什么?云计算对象存储服务OSS深度洞察
存储之外,还有什么?云计算对象存储服务OSS深度洞察
275 0
|
8天前
|
存储 数据可视化 安全
对象存储OSS产品常见问题之有几十亿个txt文件,单个4kb,使用oss如何解决
对象存储OSS是基于互联网的数据存储服务模式,让用户可以安全、可靠地存储大量非结构化数据,如图片、音频、视频、文档等任意类型文件,并通过简单的基于HTTP/HTTPS协议的RESTful API接口进行访问和管理。本帖梳理了用户在实际使用中可能遇到的各种常见问题,涵盖了基础操作、性能优化、安全设置、费用管理、数据备份与恢复、跨区域同步、API接口调用等多个方面。
40 11
|
8天前
|
存储 弹性计算 文件存储
对象存储OSS产品常见问题之OSS Bucket 创建好后更改存储类型如何解决
对象存储OSS是基于互联网的数据存储服务模式,让用户可以安全、可靠地存储大量非结构化数据,如图片、音频、视频、文档等任意类型文件,并通过简单的基于HTTP/HTTPS协议的RESTful API接口进行访问和管理。本帖梳理了用户在实际使用中可能遇到的各种常见问题,涵盖了基础操作、性能优化、安全设置、费用管理、数据备份与恢复、跨区域同步、API接口调用等多个方面。
27 0
|
8天前
|
存储 移动开发 前端开发
对象存储oss使用问题之OSS SDK .net 使用下载例程报错如何解决
《对象存储OSS操作报错合集》精选了用户在使用阿里云对象存储服务(OSS)过程中出现的各种常见及疑难报错情况,包括但不限于权限问题、上传下载异常、Bucket配置错误、网络连接问题、跨域资源共享(CORS)设定错误、数据一致性问题以及API调用失败等场景。为用户降低故障排查时间,确保OSS服务的稳定运行与高效利用。
23 0
|
28天前
|
存储 对象存储 容器
阿里云OSS对象存储基础入门
阿里云OSS对象存储基础入门
90 0
|
1月前
|
存储 域名解析 应用服务中间件
阿里云OSS对象存储,实现内网访问,免流量费用
阿里云OSS对象存储,实现内网访问,免流量费用
426 1
|
6月前
|
存储 JavaScript 应用服务中间件
OSS对象存储后端实现+Vue实现图片上传【基于若依管理系统开发】
OSS对象存储后端实现+Vue实现图片上传【基于若依管理系统开发】
641 0
|
3月前
|
存储 对象存储 SQL
【获奖名单公示】Hologres实时湖仓分析挑战赛
5分钟快速使用Hologres实时湖仓能力,无需移动数据,直接加速读取存储于数据湖OSS上的Hudi、Delta、Paimon等格式类型的数据
【获奖名单公示】Hologres实时湖仓分析挑战赛
|
6月前
|
弹性计算 关系型数据库 数据库
怎么释放资源oss对象存储
怎么释放资源oss对象存储
135 1
|
6月前
|
存储 API 对象存储
使用OSS对象存储快速搭建个人网盘
使用OSS对象存储快速搭建个人网盘
291 1