访问 OSS 这类对象存储最快的方式- JindoFS SDK |学习笔记

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介: 快速学习 访问 OSS 这类对象存储最快的方式- JindoFS SDK

开发者学堂课程【数据湖  JindoFS + OSS 实操干货 36 讲访问 OSS 这类对象存储最快的方式- JindoFS SDK】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/833/detail/13965


访问 OSS 这类对象存储最快的方式- JindoFS SDK

内容介绍:

大数据存储架构演进

JindoFS

JindoFS SDK

JindoFS 性能

 

一、大数据存储架构演进

数据湖存储方案(JindoFS SDK + 对象存储)

成本:(1)储存成本低,分层存储结合使用

(2) 运维投入少

性能:(1)海量文件下的高效元数据性能

(2)存储的读写吞吐能力

数据湖特性:(1)事务写入,多版本Checksum

(3) Jindo Table  数仓结合:Spark SQL/Hive/Presto/Impala

安全:(1)多种免密认证

(2)客户端/服务端加密


2、JindoFS

JindoFS  双模式

既是一个分布式缓存系统,为计算加速和提供优化(缓存/cache 模式)

也是一个分布式存储系统,支持高可靠高可用和安全(存储/block 模式)

 

模式

Block 模式

Cache 模式

支持对象存储

OSS

OSS/S其他云厂商对象存储

集群缓存加速

支持

支持

元数据协议

JindoFS协议

OSS/S3原生访问

元数据访问加速

支持

支持

免密访问

Ranger权限

类比方案

HDFS

Alluxio


JindoFS  客户端 Native  架构

全链路 Native

一套底层适配多个场景

图片30.png


3、JindoFS SDK

HCFS 标准

Filesystem Compatibility with Apache Hadoop

JindoFS SDK 访问 OSS

图片31.png


4、JindoFS SDK 优势

高性能

Native Object Engine 基础操作性能平均提升 2.2 倍

Jindo HCFS  对比开源版本性能大幅提升

易集成

不引入额外 Java 依赖,避免生产环境出现依赖冲突

社区模式:文档完善+在线支持

高可靠

大量客户 Hadoop  生产环境部署使用

对接引擎丰富

 

Jindo Native Object SDK vs OSS Java SDK

图片32.png

Jindo OSS Hadoop SDK vs Hadoop 现有OSS SDK

图片33.png

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
相关文章
|
4月前
|
存储 人工智能 开发工具
AI助理化繁为简,速取代码参数——使用python SDK 处理OSS存储的图片
只需要通过向AI助理提问的方式输入您的需求,即可瞬间获得核心流程代码及参数,缩短学习路径、提升开发效率。
1485 4
AI助理化繁为简,速取代码参数——使用python SDK 处理OSS存储的图片
|
2月前
|
存储 应用服务中间件 开发工具
对象存储OSS-Python设置代理访问请求
通过 Python SDK 配置 nginx 代理地址请求阿里云 OSS 存储桶服务。示例代码展示了如何使用 RAM 账号进行身份验证,并通过代理下载指定对象到本地文件。
114 15
|
4月前
|
存储 人工智能 缓存
AI助理直击要害,从繁复中提炼精华——使用CDN加速访问OSS存储的图片
本案例介绍如何利用AI助理快速实现OSS存储的图片接入CDN,以加速图片访问。通过AI助理提炼关键操作步骤,避免在复杂文档中寻找解决方案。主要步骤包括开通CDN、添加加速域名、配置CNAME等。实测显示,接入CDN后图片加载时间显著缩短,验证了加速效果。此方法大幅提高了操作效率,降低了学习成本。
5533 16
|
4月前
|
存储 网络安全 对象存储
缺乏中间证书导致通过HTTPS协议访问OSS异常
【10月更文挑战第4天】缺乏中间证书导致通过HTTPS协议访问OSS异常
234 4
|
7月前
|
分布式计算 DataWorks 数据处理
MaxCompute操作报错合集之UDF访问OSS,配置白名单后出现报错,是什么原因
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
|
7月前
|
域名解析 Serverless API
函数计算产品使用问题之如何配置自定义域名访问OSS中的内容
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
16天前
|
前端开发 Java Shell
【08】flutter完成屏幕适配-重建Android,增加GetX路由,屏幕适配,基础导航栏-多版本SDK以及gradle造成的关于fvm的使用(flutter version manage)-卓伊凡换人优雅草Alex-开发完整的社交APP-前端客户端开发+数据联调|以优雅草商业项目为例做开发-flutter开发-全流程-商业应用级实战开发-优雅草Alex
【08】flutter完成屏幕适配-重建Android,增加GetX路由,屏幕适配,基础导航栏-多版本SDK以及gradle造成的关于fvm的使用(flutter version manage)-卓伊凡换人优雅草Alex-开发完整的社交APP-前端客户端开发+数据联调|以优雅草商业项目为例做开发-flutter开发-全流程-商业应用级实战开发-优雅草Alex
117 20
【08】flutter完成屏幕适配-重建Android,增加GetX路由,屏幕适配,基础导航栏-多版本SDK以及gradle造成的关于fvm的使用(flutter version manage)-卓伊凡换人优雅草Alex-开发完整的社交APP-前端客户端开发+数据联调|以优雅草商业项目为例做开发-flutter开发-全流程-商业应用级实战开发-优雅草Alex
|
6月前
|
JavaScript 前端开发 Java
[Android][Framework]系统jar包,sdk的制作及引用
[Android][Framework]系统jar包,sdk的制作及引用
165 0
|
3月前
|
Java Linux API
Android SDK
【10月更文挑战第21天】
143 1
|
4月前
|
程序员 开发工具 Android开发
Android|使用阿里云推流 SDK 实现双路推流不同画面
本文记录了一种使用没有原生支持多路推流的阿里云推流 Android SDK,实现同时推送两路不同画面的流的方法。
91 7

热门文章

最新文章