文档备案控制台

开发者社区大数据与机器学习开源大数据平台 E-MapReduce 正文

JindoFS是什么？

JindoFS是什么？

展开

收起

Lee_tianbai 2021-01-07 15:24:08 1586 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

Lee_tianbai

Jindo 是阿里云基于 Apache Spark / Apache Hadoop 在云上定制的分布式计算和存储引擎。Jindo 原是阿里云开源大数据团队的内部研发代号，取自筋斗(云)的谐音， Jindo 在开源基础上做了大量优化和扩展，深度集成和连接了众多阿里云基础服务。

JindoFS 是阿里云针对云上存储自研的大数据缓存加速服务，JindoFS 的设计理念是云原生：弹性、高效、稳定和低成本。JindoFS 完全兼容 Hadoop 文件系统接口，给客户带来更加灵活、高效的数据湖加速方案，完全兼容阿里云 EMR 中所有的计算服务和引擎：Spark、Flink、Hive、MapReduce、Presto、Impala 等。JindoFS 有两种使用模式，块存储模式(BLOCK)和缓存模式(CACHE)。下面我们介绍下如何在 EMR 中配置和使用 JindoFS 以及不同模式对应的场景。

2021-01-07 15:24:32

赞同展开评论

问答分类：

开源大数据平台 E-MapReduce

问答地址：

开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 问答

相关问答

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

287356

11

0

购买阿里国外的云服务器是否可以访问谷歌？

93744

50

0

this xml file does not appear to have any style in

62063

11

0

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

142978

16

0

基础语言百问-Python

70219

30

0

搭建dnf私服需要大概啥配置的

10825

2

0

#支付宝授权提示请在支付宝客户端打开链接

25678

19

0

阿里云怎样设置二级域名以及域名解析？

67074

14

0

全息（Holography）技术是什么技术？

1381

1

0

C语言中default使用注意事项是什么？

1765

1

0

大数据与机器学习

开源大数据平台 E-MapReduce

阿里云EMR是云原生开源大数据平台，为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎，计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

我要提问

收录在圈子:

阿里云E-MapReduce

2323

+ 订阅

相关文章

StarRocks x Fluss x Paimon 湖流一体方案：构建秒级响应、湖流一体的实时数据引擎

EMR Serverless Daft 如何简化多模态数据处理：视频抽帧、清洗、标注全流程与具身智能实践

阿里云 EMR Serverless StarRocks（Stella 2.2.0）发布：多模态处理与分析闭环，内表与湖表统一检索

EMR Serverless StarRocks Stella 能力解读，从海量广告素材、游戏聊天数据到金融 RAG 的一站式 SQL 实践

EMR Serverless Spark PB级文本语义去重4倍加速的技术方案解读

热门讨论

热门文章

企业定制软件开发全流程该怎么管控，才能不延期不超预算？

NeuSoft是什么？

数据湖的对接主要体现在哪几个方面？

现在emr可以直接配置dolphin进行任务调度了吗？

starrocks通过DLF2.0建立外部表，可以进行delete或者update表数据的操作吗？

Spark访问OSS数据采用什么方式？

核桃编程的业务需求是什么？

数据湖存储OSS是什么？

HDFS是如何实现低资源消耗的？

S3DistCp是什么？

展开全部

分布式快照算法: Chandy-Lamport

现代流式计算的基石：Google DataFlow

如何使用Kafka Connect实现同步RDS binlog数据

JindoFS: 云上大数据的高性能数据湖存储方案

如何在Aliyun E-MapReduce集群上使用Zeppelin和Hue

HIVE MapJoin异常问题处理总结

JindoFS概述：云原生的大数据计算存储分离方案

5W1H(六何分析法)全景洞察大数据

Flume NG 简介及配置实战

【译】用SQL统一所有：一种有效的、语法惯用的流和表管理方法

展开全部

还有其他疑问?