Presto 访问 OSS 透明缓存加速 | 学习笔记

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,内容安全 1000次 1年
对象存储 OSS,恶意文件检测 1000次 1年
简介: 快速学习 Presto 访问 OSS 透明缓存加速。

开发者学堂课程【数据湖 JindoFS + OSS 实操干货36讲Presto 访问 OSS 透明缓存加速 】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/833/detail/13973


Presto 访问 OSS 透明缓存加速

 

内容介绍

一、JindoFS 缓存模式简介

二、Presto 访问 OSS 的缓存加速

三、实操演示

 

一、JindoFS 缓存模式简介

两大服务主件:

Jindo Namespace Service(负责缓存数据快的信息管理)

Jindo Storage Service(部署在节点上,利用本地存储资源实现缓存加速)

一个客户端:Jindo SDK

 

二、Presto 访问OSS的缓存加速

1.部署缓存服务

(1)下载最新 Release b2smartdata-x.x.x.tar.gz ,解压并部署到集群所有节点上

2)修改配置文件 conf/bigboot.cfg

 1.png

3)修改 sbin/nodes,配置所有 storage service 的节点列表

4)启动所有服务/sbin/start-service.sh

详细文档可参考:https://gitub.com/aliyun/alibabacloud-jindofs/blob/master/docs/jindofs_cache_mode_deploy.md

2.部署 Jindo SDK

1)安装 jar 包:下载最新的 jar jindofs-sdk-x.x.x.jar,在所有 Presto 节点安装。cpjindofs- sdk-$ {version} .jar$PRESTO_HOME/plugin/hive-hadoop2/

2)配置 JindoFS 实现类:将JindoFS 实现类配置到 Hadoop core-site.xml中。

3.配置 OSS Access Key

OSS Access KeyAccess Key SecretEndpoint 等预先配置在Hadoopcore-site.xml 中。

4.配置客户端连接缓存服务

客户端通过环境变量 B2SDK_CONF_DIR 定位并加载配置文件 bigboot.cfg

·设置环境变量指定配置目录

export B2SDK_CONF_DIR=/path/to/sdk/conf

·在配置目录下添加 bigboot.cfg 配文件

·client.storage.rpc.port=6101

·client.namespace.rpc.address= :8101

·jfs.cache.data-cache.enable=true2.png5.Presto 访问 OSS 透明缓存加速

·完成以上配置之后,重启 Presto 所有服务

·hive catalog 即可访问 OSS

·Presto SQL 读取 OSS 上的数据后,会自动缓存到 JindoFS 缓存系统中,后续访问相同的数据就能够命中缓存


三、实操演示

·JindoFS 缓存服务配置:3.png

·启动后进程会监听在8104端口上,通过浏览器查看8104端口,可以查看整个JindoFS 的状态信息,配置的节点和磁盘水位。

4.png完成以上检查后,即可确认一个缓存服务的可用状态

·以下为在 Presto 中如何使用 SDK 来缓存加速数据5.png

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
相关文章
|
4月前
|
缓存 NoSQL 网络安全
【Azure Redis 缓存】Azure Redis服务开启了SSL(6380端口), PHP如何访问缓存呢?
【Azure Redis 缓存】Azure Redis服务开启了SSL(6380端口), PHP如何访问缓存呢?
|
11天前
|
存储 应用服务中间件 开发工具
对象存储OSS-Python设置代理访问请求
通过 Python SDK 配置 nginx 代理地址请求阿里云 OSS 存储桶服务。示例代码展示了如何使用 RAM 账号进行身份验证,并通过代理下载指定对象到本地文件。
55 15
|
2月前
|
存储 人工智能 缓存
AI助理直击要害,从繁复中提炼精华——使用CDN加速访问OSS存储的图片
本案例介绍如何利用AI助理快速实现OSS存储的图片接入CDN,以加速图片访问。通过AI助理提炼关键操作步骤,避免在复杂文档中寻找解决方案。主要步骤包括开通CDN、添加加速域名、配置CNAME等。实测显示,接入CDN后图片加载时间显著缩短,验证了加速效果。此方法大幅提高了操作效率,降低了学习成本。
5477 16
|
2月前
|
存储 网络安全 对象存储
缺乏中间证书导致通过HTTPS协议访问OSS异常
【10月更文挑战第4天】缺乏中间证书导致通过HTTPS协议访问OSS异常
144 4
|
4月前
|
缓存 NoSQL 网络安全
【Azure Redis 缓存】在Azure Redis中,如何限制只允许Azure App Service访问?
【Azure Redis 缓存】在Azure Redis中,如何限制只允许Azure App Service访问?
|
4月前
|
缓存 NoSQL Redis
【Azure Redis 缓存】C#程序是否有对应的方式来优化并缩短由于 Redis 维护造成的不可访问的时间
【Azure Redis 缓存】C#程序是否有对应的方式来优化并缩短由于 Redis 维护造成的不可访问的时间
|
4月前
|
缓存 NoSQL Redis
【Azure Redis 缓存】Azure Redis加入VNET后,在另一个区域(如中国东部二区)的VNET无法访问Redis服务(注:两个VNET已经结对,相互之间可以互ping)
【Azure Redis 缓存】Azure Redis加入VNET后,在另一个区域(如中国东部二区)的VNET无法访问Redis服务(注:两个VNET已经结对,相互之间可以互ping)
|
4月前
|
缓存 NoSQL 网络协议
【Azure Redis 缓存】如何使得Azure Redis可以仅从内网访问? Config 及 Timeout参数配置
【Azure Redis 缓存】如何使得Azure Redis可以仅从内网访问? Config 及 Timeout参数配置
|
4月前
|
缓存 NoSQL 网络协议
【Azure Redis 缓存 Azure Cache For Redis】在创建高级层Redis(P1)集成虚拟网络(VNET)后,如何测试VNET中资源如何成功访问及配置白名单的效果
【Azure Redis 缓存 Azure Cache For Redis】在创建高级层Redis(P1)集成虚拟网络(VNET)后,如何测试VNET中资源如何成功访问及配置白名单的效果
|
5月前
|
域名解析 Serverless API
函数计算产品使用问题之如何配置自定义域名访问OSS中的内容
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。