• 关于

    parquet格式的表适合在哪?

    的搜索结果
  • 18个PPT,29个提问解答,都在这儿啦!

    4月25-26日,全球首个 Apache 顶级项目在线盛会 Flink Forward 中文精华版重磅开播,聚焦 Alibaba、 Google、AWS、Uber、Netflix、DellEMC、微博、滴滴等各大互联网公司实时计算的经典场景和业务故事,由 Flink 核心贡献者们对 19 个优质 ...

    文章 阿里云实时计算Flink 2020-04-28 828浏览量

  • 开放下载!18个PPT,29个提问解答,都在这儿啦!

    点击免费下载18个PPT资料包>>> 4月25-26日,全球首个 Apache 顶级项目在线盛会 Flink Forward 中文精华版重磅开播,聚焦 Alibaba、 Google、AWS、Uber、Netflix、DellEMC、微博、滴滴等各大互联网公司实时计算的经典场景和...

    文章 阿里云实时计算Flink 2020-04-28 16606浏览量

  • 《Spark与Hadoop大数据分析》——2.1 Apache Hadoop概述

    2.1 Apache Hadoop概述 Apache Hadoop 是一个软件框架,可以在具有数千个节点和 PB 级数据的大型集群上进行分布式处理。Apache Hadoop 集群可以使用故障率一般较高的低价通用硬件来构建。Hadoop 的设计能够在没有用户干预的情况下优雅地处理这些故障。此外,H...

    文章 华章计算机 2017-09-01 1387浏览量

  • 《Spark与Hadoop大数据分析》一一2.1 Apache Hadoop概述

    本节书摘来自华章计算机《Spark与Hadoop大数据分析》一书中的第2章,第2.1节,作者:文卡特·安卡姆(Venkat Ankam) 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.1 Apache Hadoop概述 Apache Hadoop 是一个软件框架,可以在具有数千个节点...

    文章 华章计算机 2017-07-03 1928浏览量

  • 万亿级日志与行为数据存储查询技术剖析——Hbase系预聚合方案、Dremel系parquet列存储、预聚合系、Lucene系

    转自:http://www.infoq.com/cn/articles/trillion-log-and-data-storage-query-techniques?utm_source=infoq&utm_medium=popular_widget&utm_campaign=po...

    文章 桃子红了呐 2017-11-01 1670浏览量

  • Delta Lake,让你从复杂的Lambda架构中解放出来

    作者介绍李潇,现就职于 Databricks,管理两跨国团队,专注于 Apache Spark, Databricks Runtime 和 Koalas 的开发和建设。他是 Apache Spark 项目管理委员会成员。本科毕业于南京理工大学,后在佛罗里达大学(University of Flor...

    文章 开源大数据EMR 2020-03-09 1203浏览量

  • Flink 如何实时分析 Iceberg 数据湖的 CDC 数据

    本文由李劲松、胡争分享,社区志愿者杨伟海、李培殿整理。主要介绍在数据湖的架构中,CDC 数据实时读写的方案和原理。文章主要分为 4 个部分内容:常见的 CDC 分析方案为何选择 Flink + Iceberg如何实时写入读取未来规划一、常见的 CDC 分析方案我们先看一下今天的 topic 需要设...

    文章 阿里云实时计算Flink 2021-02-24 2610浏览量

  • “数据湖”:概念、特征、架构与案例

    写在前面:最近,数据湖的概念非常热,许多前线的同学都在讨论数据湖应该怎么建?阿里云有没有成熟的数据湖解决方案?阿里云的数据湖解决方案到底有没有实际落地的案例?怎么理解数据湖?数据湖和大数据平台有什么不同?头部的云计算玩家都各自推出了什么样的数据湖解决方案?带着这些问题,我们尝试写了这样一篇文章,希...

    文章 skin778 2020-05-19 6901浏览量

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT