开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 正文

基于 OSS 的数据湖存储是否满足高效数据计算的特性?

基于 OSS 的数据湖存储是否满足高效数据计算的特性?

展开
收起
Lee_tianbai 2021-01-07 15:21:55 1299 0
1 条回答
写回答
取消 提交回答
  •  OSS 提供 RESTFul API,具有互联网可访问能力,用户可以随时随地立即存储或者 访问数据,无需提前进行映射和挂载操作。

     OSS 兼容开源 Hadoop 生态,且无缝对接阿里云多种不同的计算平台,使得数据无需 拷贝即可被计算平台共享使用。同时针对部分计算平台优化特定操作,从而提升数据处 理性能。

     OSS 支持算子卸载能力,目前提供了 Select 语句支持,可以让用户从单个文件中仅 读取需要的数据,从而提升数据获取效率。

    2021-01-07 15:22:08
    赞同 展开评论 打赏

阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

相关电子书

更多
DLA 一站式数据湖管理-如何高效构建安全的数据湖? 立即下载
阿里云云原生数据湖体系全解读 立即下载
数据湖存储解决方案蓝皮书 立即下载