云原生大数据计算服务 MaxCompute

首页 标签 云原生大数据计算服务 MaxCompute
# 云原生大数据计算服务 MaxCompute #
关注
37069内容
数据仓库介绍与实时数仓案例
1.数据仓库简介 数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。
【资料合集】阿里巴巴开源技术汇总——内含115个软件与100+技术文档、PDF下载
为了更好地让开发者们深入了解阿里开源,本文对社区内发布过的开源技术精品内容做了一次大汇总,包括115个阿里巴巴开源技术、阿里巴巴73款开源产品全向图、首届阿里开源峰会PDF+活动视频回顾等等。
2019年1月&2月云栖技术活动汇总:50+直播与Meetup资料下载
PostgreSQL: 线上直播: 直播主题:PostgreSQL多场景阿里云沙箱实验(第9讲):PostgreSQL 时空业务实践直播回顾: https://yq.aliyun.com/live/794讲师:德哥 — 阿里云数据库专家,PostgreSQL中国社区校长学习资料:https://yq.
【百科】详解阿里云技术核心——飞天
飞天(Apsara)是由阿里云自主研发、服务全球的超大规模通用计算操作系统。它可以将遍布全球的百万级服务器连成一台超级计算机,以在线公共服务的方式为社会提供计算能力。
大数据分布式架构单点故障详解(Hdfs+Yarn+HBase+Spark+Storm)构建HA高可用架构
本文梳理了常见的hadoop生态圈中的组件:Hdfs+Yarn+HBase+Spark+Storm的单点故障问题,出现原因以及单点故障的原理和解决方案(构建HA(High Available)高可用架构)。阅读本文之前,最好了解清楚各组件的架构原理。
MaxCompute执行作业慢的原因排查
大家在平时开发过程中经常遇到作业(SQL、MR等)执行慢的原因,今天带大家一起学习自排查方法。 1、wait wait ,job querying 遇到这个提示,就是资源出现了排队,如果你是后付费用户,那就是整个后付费的共享池已经没有富余的资源了,要等前一个作业处理完。
阿里云MaxCompute(大数据)公开数据集---带你玩转人工智能
目前阿里云大数据产品已经免费向全部用户开放了多种公用数据集。开放的数据类别包括:股票价格数据,房产信息,影视及其票房数据。
用Spark分析Amazon的8000万商品评价(内含数据集、代码、论文)
尽管数据科学家经常通过分布式云计算来处理数据,但是即使在一般的笔记本电脑上,只要给出足够的内存,Spark也可以工作正常(在这篇文章中,我使用2016年MacBook Pro / 16GB内存,分配给Spark 8GB内存)。
大数据分析的下一代架构--IOTA架构设计实践
IOTA的特点: [x] 去“ETL”化 [x] 高效:时时入库即时分析 [x] 稳定:经过易观5.8Pb,5.2亿月活数据锤炼 [x] 便捷:支持SQL级别的二次开发和UDAF定义 [x] 扩充性强:组件基于Apache开源协议,可支持众多开源存储对接
【资料合集】2017云栖大会 成都峰会全面回顾:PDF下载+现场视频
2017云栖大会 成都峰会全方位展示最新云上产品,以全新视角解读大数据时代下的新营销。云栖社区特将本次峰会的讲义PDF+活动视频整理出来,以供大家学习参考。
免费试用