大数据计算 MaxCompute-博文-第22页-阿里云开发者社区-阿里云

隐林

|

存储分布式计算监控

|

博文

MaxCompute2.0助力众安保险快速成长

摘要：2017云栖大会阿里云大数据计算服务（MaxCompute）专场，众安保险数据总监王超群带来MaxCompute助力众安保险方面的演讲。本文主要从MaxCompute优势开始谈起，进而谈及大数据能够公司运营带来的好处，最后重点分析了众安保险的数据平台建设，包括任务调度、元数据和数据质量监控等。

4777 0 0

隐林

|

SQL 分布式计算大数据

|

博文

MaxCompute 2.0 基于BigBench标准的最新测试进展

10月14日，2017杭州云栖大会·阿里云大数据计算服务（MaxCompute）专场，阿里云技术专家路璐带来《MaxCompute基于BigBench标准的最新测试进展》分享。在11日的主论坛上，MaxCompute做了敢为人先、引领潮流BigBench On MaxCompute2.0的重磅发布，意味着MaxCompute成为第一个做到100TB数据规模的BigBench，并且在100T数据规模的Qpm达到7830Qpm，成为第一个达到7000分的大数据引擎。

4191 0 0

隐林

|

存储分布式计算大数据

|

博文

MaxCompute2.0索引优化实践

摘要：2017云栖大会阿里云大数据计算服务（MaxCompute）专场，阿里云高级专家戴谢宁带来MaxCompute的索引与优化实践分享。本文主要从MaxCompute数据模型开始谈起，接着分享了哈希分片和区域分片，着重分析了索引优化和join优化，并且列出了应用实例，最好作出了简要总结。

4589 0 1

晋恒

|

SQL 分布式计算 MaxCompute

|

博文

Installation and Operation Guide for BigBench on MaxCompute Benchmarking Suite

This article describes how to install and run the BigBench on MaxCompute.

2018 0 0

振禹

|

SQL 分布式计算 MaxCompute

|

博文

MaxCompute - ODPS重装上阵　第一弹 - 善用MaxCompute编译器的错误和警告

MaxCompute (ODPS) ( __注1__ )是阿里云自主研发的具有业界领先水平的分布式大数据处理平台, 尤其在集团内部得到广泛应用，支撑了多个BU的核心业务。 ODPS2.0除了持续优化性能外，也致力于提升SQL语言的用户体验和表达能力，提高广大ODPS开发者的生产力。

5051 0 1

振禹

|

SQL 分布式计算 Java

|

博文

MaxCompute - ODPS重装上阵　第二弹 - 新的基本数据类型与内建函数

MaxCompute（原ODPS）是阿里云自主研发的具有业界领先水平的分布式大数据处理平台, 尤其在集团内部得到广泛应用，支撑了多个BU的核心业务。 MaxCompute除了持续优化性能外，也致力于提升SQL语言的用户体验和表达能力，提高广大ODPS开发者的生产力。

7752 0 0

振禹

|

SQL 分布式计算 Java

|

博文

MaxCompute - ODPS重装上阵　第三弹 - 复杂类型

MaxCompute（原ODPS）是阿里云自主研发的具有业界领先水平的分布式大数据处理平台, 尤其在集团内部得到广泛应用，支撑了多个BU的核心业务。 MaxCompute除了持续优化性能外，也致力于提升SQL语言的用户体验和表达能力，提高广大ODPS开发者的生产力。

8576 0 1

隐林

|

机器学习/深度学习人工智能分布式计算

|

博文

10月18日，德国法兰克福，阿里云MaxCompute2.0，全面布局AI人工智能

在2017年杭州云栖大会上，阿里云宣布大数据计算服务MaxCompute将于10月18日在德国法兰克福正式开服。通过MaxCompute2.0全新一代的人工智能系统，阿里云将携手更多欧洲本地合作伙伴建立科技生态，驱动当地云计算和大数据的发展，将中国先进的云计算推广至海外，在人工智能、深度学习等领域实现突破创新。

10546 0 0

晋恒

|

分布式计算 MaxCompute

|

博文

Breakthrough in Alibaba Cloud Computing Capabilities - BigBench Reaches 100 TB World Record

Alibaba Cloud's BigBench on MaxCompute expands that capacity to 100 TB for the first time in the world, which is also the first benchmark to be based on public cloud services.

2169 0 0

薛明

|

分布式计算数据可视化 MaxCompute

|

博文

MaxCompute Studio 2.8.1 新版本发布啦！

MaxCompute Studio 2.8.1 新版本发布，重磅介绍可视化作业自助分析等功能！

2798 0 0

隐林

|

新零售人工智能分布式计算

|

博文

赋能数据处理能力阿里云MaxCompute助企业洞察市场

阿里云在上月中，就将MaxCompute大数据计算服务向香港市场开放上线，此前该服务已先后于中国大陆及新加坡推出。阿里巴巴集团旗下电子商务平台最大特点及优势，在于其平台上的人工智能及大数据处理能力，可以洞察消费者的需要，并因不同人的偏好而提供个性化设定，大大提升消费者体验，并可为商家反馈重要的市场数据，从而精准去计划市场策略。

2436 0 0

祎休

|

大数据 Apache 云栖大会

|

博文

阿里云与Apache Flink商业公司DataArtisans于2017杭州云栖大会达成战略合作并发布

10月12日，Apache Flink商业公司DataArtisans CEO、联合创始人Kostas Tzoumas在云栖大会上宣布和阿里集团达成战略合作伙伴关系，希望能够借助全球最大的云计算公司之一阿里云，服务更多的大数据实时流计算的客户。

4898 0 0

祎休

|

分布式计算监控大数据

|

博文

[干货]作为大数据入门者，你不得不知道的2017杭州云栖大会

2017杭州云栖大会于10月14日完美闭幕，据说今年6W+人的技术盛宴（我们先不追究具体多少人）。大家可能更多的只知道马老师谈及到阿里巴巴达摩院、听到各种刷脸支付的高科技、各种数据大脑的发布，但是我觉得作为一个大数据入门者，你只知道这些远远不够！

5700 0 1

隐林

|

分布式计算 MaxCompute

|

博文

MaxCompute执行作业慢的原因排查

大家在平时开发过程中经常遇到作业（SQL、MR等）执行慢的原因，今天带大家一起学习自排查方法。 1、wait wait ，job querying 遇到这个提示，就是资源出现了排队，如果你是后付费用户，那就是整个后付费的共享池已经没有富余的资源了，要等前一个作业处理完。

27823 5 7

隐林

|

存储分布式计算大数据

|

博文

阿里云计算能力实现多项突破 BigBench规模全球首次被拓展至100TB

10月12日，阿里巴巴集团副总裁周靖人在云栖大会上发布了阿里云在大数据计算能力上的新突破：将BigBench数据规模扩展到100T；流计算2.0每秒峰值达千万QPS，整体链路延时亚秒级；E-MapReduce对比同类产品平均性能提升3倍。

3322 0 0

隐林

|

存储算法

|

博文

CloudSort 阿里云 2016 夺冠，性价比高出 AWS 保持的世界记录三倍

3048 0 0

晋恒

|

分布式计算大数据 Devops

|

博文

阿里云全新一代企业级新品解读—通过MaxCompute Studio实践大数据时代的DevOps

今天是2017杭州·云栖大会的第一天，这场科技盛宴吸引了来自全球的参展商、开发者、相关从业人员以及科技爱好者。在今天上午的主论坛，阿里云总裁胡晓明在发言中重点提及的新一代计算平台MaxCompute将在本次大会中多次亮相。

9081 0 1

隐林

|

SQL 分布式计算大数据

|

博文

MaxCompute常用语句汇总(更新ing)

收集一些MaxCompute常用命令。

11929 0 1

隐林

|

存储分布式计算大数据

|

博文

仁人帮探索大数据技术

前两期小帮为大家介绍了仁人帮的大数据定义与大数据在仁人帮后台的应用。今天也不跟大家卖关子了，接下来，小帮为大家奉上的是大数据平台技术的探索。大数据技术，小帮认为可以分成两个大的层面，大数据平台技术与大数据应用技术。

4556 0 1

隐林

|

机器学习/深度学习人工智能分布式计算

|

博文

用炸弹开路——加速到来的证券投资行业人工智能时代

去年开始涉足人工智能技术应用于证券投资领域的研究，将近两年的研究实践，发现公开资料上很多关于人工智能（AI）对证券投资业发展影响的文章都存在几个明显的思维误区：①一个是对人工智能的认识有误。人工智能是个广域笼统的概念，但基石是机器学习，以机器学习算法构建逻辑和规则为基石的人工智能与自动化程序软件及通过数据回测构建起来的以固定逻辑运行的量化投资模型是完全不同的事物，区别就好比活鸡和模型鸡，需要明白自动化软件不是人工智能，国内大多数所谓智能投顾其实还不是真正意义上的人工智能投顾；②另一个是曲解了人工智能在证券投资行业的应用。

2931 0 1

祎休

|

SQL 监控关系型数据库

|

博文

2017云栖大会·杭州峰会：《在线用户行为分析：基于流式计算的数据处理及应用》之《流数据处理：通过StreamSQL分析视频日志》篇

3195 0 0

祎休

|

数据采集弹性计算监控

|

博文

2017云栖大会·杭州峰会：《在线用户行为分析：基于流式计算的数据处理及应用》之《流数据采集：海量流式视频日志收集》篇

3795 0 1

祎休

|

监控数据可视化大数据

|

博文

2017云栖大会·杭州峰会：《在线用户行为分析：基于流式计算的数据处理及应用》实验环境准备

5753 0 0

祎休

|

监控数据可视化大数据

|

博文

2017云栖大会·杭州峰会：《在线用户行为分析：基于流式计算的数据处理及应用》Workshop-入口

3661 0 0

隐林

|

人工智能分布式计算大数据

|

博文

阿里云MaxCompute澳大利亚开服，“领跑”人工智能市场

9月27日，阿里云宣布大数据计算服务MaxCompute将于10月10日在澳大利亚正式开服。通过MaxCompute强大的计算能力，阿里云将为澳大利亚市场提供更多的人工智能产品，助力当地企业智能化升级。

3012 0 0

祎休

|

分布式计算大数据测试技术

|

博文

从未停止进化的MaxCompute

2017云栖大会·杭州峰会将于10月10日-14日在杭州云栖小镇隆重举行，据相关数据显示大会多场主题分论坛门票都已经售罄。在这110余场主题分论坛中，可能备受大家最为感兴趣是人工智能、大数据的专场。大数据的热度在深圳峰会、成都峰会、上海峰会都逐一印证。

6677 0 0

隐林

|

SQL 分布式计算算法

|

博文

MaxCompute SQL原理解析及性能调优

分享内容介绍了ODPS SQL的基于mapreduce是如何实现的及一些使用小技巧，回顾了mapreduce各个阶段可能产生的问题及相应的处理方法，同时介绍了一些应对数据倾斜的处理方法，最后介绍了一些关于数据集构造、特征选择的技巧帮助减少资源利用。

12844 0 0

隐林

|

机器学习/深度学习算法大数据

|

博文

阿里云机器学习平台的思考

最近读了阿里的《大数据之路-阿里巴巴大数据实践》，对于其机器学习平台也蛮感兴趣，正好阿里出了本新书《解析阿里云机器学习平台》，顺便读了下，感触也不少，结合最近团队机器学习的一些思考，特别在此分享于你。

13527 0 2

隐林

|

分布式计算大数据 Hadoop

|

博文

比自建 Hadoop 还便宜！云栖大会揭秘阿里云数加 MaxCompute

DT时代，越来越多的企业应用数据步入云端。 Hadoop是当下流行的大数据并行计算体系，横向扩展、生态圈成熟等一直是它的主要特点。阿里云数加MaxCompute (原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案。

12591 0 0

隐林

|

人工智能分布式计算大数据

|

博文

阿里云MaxCompute香港开服引入更多人工智能

　9月18日，阿里云宣布大数据计算服务MaxCompute在香港正式开服。通过MaxCompute强大的计算能力，阿里云将为香港市场提供更多的人工智能产品，助力当地企业智能化升级。

7569 0 0

隐林

|

存储分布式计算大数据

|

博文

iphoneX都面世了，你的数据仓库还停留在诺基亚时代吗?

刚刚过去的苹果秋季发布会上，万众瞩目的iPhoneX 手机亮相。十年前，首代iPhone开启了颠覆键盘功能机的序幕，十年过去了，智能触屏手机已经彻底普及。关注个人智能手机升级的IT人士，是否也了解你的企业数仓有没有跟上潮流趋势呢?是否升级到弹性分布式系统。

10423 2 2

隐林

|

分布式计算大数据 DataX

|

博文

阿里巴巴下一代数据集成技术

数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中，从而为企业提供全面的数据共享。在企业数据集成领域，已经有了很多成熟的框架可以利用。目前通常采用联邦式、基于中间件模型和数据仓库等方法来构造集成的系统，这些技术在不同的着重点和应用上解决数据共享和为企业提供决策支持。

7521 0 0

隐林

|

大数据容器

|

博文

1次演讲13次提到技术，马云在阿里巴巴年会上都说了什么？

阿里巴巴是一个奇迹，18年前的今天，阿里巴巴只有18人和50万人民币，18年后的今天，拥有54421名员工，市值4426亿美金，亚洲第1，全球第6。慕名上门拜访的各国高级政要更是络绎不绝，企业做到这份上，阿里巴巴算是独一家。

6077 0 0

隐林

|

数据采集分布式计算监控

|

博文

阿里数据仓库实践分享

数据仓库，是为企业所有级别的决策制定过程，提供所有类型数据支持的战略集合。它是单个数据存储，出于分析性报告和决策支持目的而创建。为需要业务智能的企业，提供指导业务流程改进、监视时间、成本、质量以及控制。

16329 1 1

隐林

|

SQL 分布式计算资源调度

|

博文

MaxCompute常见错误汇总（更新ing）

从今天开始，小编会为大家陆续解读MaxCompute常见问题，帮助大家快速上手MaxCompute，玩转大数据计算平台。

24942 8 9

隐林

|

新零售存储分布式计算

|

博文

阿里巴巴MaxCompute亮相VLDB2017

[摘要]8月28日-9月1日，第四十三届VLDB会议在德国慕尼黑举行。阿里巴巴在本届VLDB展区重点展示了MaxCompute、ApsaraDB、AliSQL、AnalyticDB和POLARDB等数据库和数据处理技术，引起现场与行业专家学者的注意和交流探讨。

4953 0 0

隐林

|

大数据

|

博文

DT时代已经悄然来临，IT人您跟上了吗？

什么是DT时代？在2015年中国（深圳）IT领袖峰会上，马云发表演讲：过去7年我们从互联网创业到互联网产业，很快进入互联网经济，而且正在从IT走向DT时代，也许昨天称为IT领袖峰会，未来要称DT领袖峰会，DT不仅仅是技术提升，而是思想观念的提升。

6270 0 0

杰红

|

SQL 大数据

|

博文

SQL优化器原理-Metadata

这是MaxCompute有关SQL优化器原理的系列文章之一。我们会陆续推出SQL优化器有关优化规则和框架的其他文章。添加钉钉群“关系代数优化技术”（群号11719083）可以获取最新文章发布动态(二维码在文章末尾)。

6580 0 0

meetyou_九戒

|

弹性计算分布式计算 MaxCompute

|

博文

美柚与MaxCompute数据同步架构说明

11233 0 0

海清

|

弹性计算分布式计算大数据

|

博文

阿里云大数据计算服务MaxCompute（原ODPS）华南1（深圳）Region即将开服！

2017年9月7日，阿里云数加·MaxCompute（原ODPS）华南1（深圳）数据中心正式开服售卖，这是数加·MaxCompute在国内开服的第二个区域。届时MaxCompute将会针对新服开展促销活动，具体活动规则敬请期待！

3105 0 0

xiangel

|

SQL 分布式计算 MaxCompute

|

博文

odps之sql性能优化

前一段时间做了一些作业成本优化的工作，这里做下总结。首先说明本篇中谈及的优化主要的目标是在不大幅度增加作业运行时长的条件下对作业运行成本的优化。 ## 1. odps的优化引擎并没有那么智能 odps自带的优化引擎会对sql作业做一定的优化处理，如列裁剪、分区裁剪和谓词下推。

9210 0 2

隐林

|

存储人工智能分布式计算

|

博文

数据智能需求旺盛阿里云MaxCompute 2.0华南区开服

8月31日，阿里云宣布将在深圳区域正式部署大数据计算服务MaxCompute，以进一步提升对华南区域客户服务的响应速度，并推动该地域人工智能产业的发展。此前，凭借大规模计算存储、多种计算模型、强数据安全和低成本的优势，MaxCompute一直供不应求。

5049 0 0

xinyuan6009

|

分布式计算 Java 大数据

|

博文

IDEA集成MaxCompute

6632 0 0

上单

|

分布式计算大数据关系型数据库

|

博文

阿里云大数据利器之-RDS迁移到Maxcompute实现动态分区

当前，很多用户的业务数据存放在传统关系型数据库上，例如阿里云的RDS，做业务读写操作。当数据量非常大的时候，此时传系关系型数据库会显得有些吃力，那么会经常有将mysql数据库的数据迁移到[大数据处理平台-大数据计算服务（Maxcompute，原ODPS）(https://www.aliyun.com/product/odps?spm=5176.doc27800.765261.309.dcjpg2)，利用其强大的存储和计算能力进行各种查询计算，结果再回流到RDS。

9980 0 0

黯灭_邓彬

|

机器学习/深度学习

|

博文

机器学习系列直播--使用对抗神经网络(GANs)生成猫【8月30日 20点不见不散】

对抗神经网络模型(GANs)作为当下最火的神经网络模型使用GANs我们可以还原图像原始颜色可以还原马赛克: 可以把漫画变成真实图像可以把文字变成图像还可以进行视频下一帧预测.

5361 0 0

勿烦

|

SQL 分布式计算 MaxCompute

|

博文

SQL优化器原理 - Auto Hash Join

在MaxCompute中，Join操作符的实现算法之一名为"Hash Join"，其实现原理是，把小表的数据全部读入内存中，并拷贝多份分发到大表数据所在机器，在 map 阶段直接扫描大表数据与内存中的小表数据进行匹配。

9967 0 0

龙重

|

SQL 分布式计算算法

|

博文

SQL优化器原理－Shuffle优化

分布式系统中，Shuffle是重操作之一，直接影响到了SQL运行时的效率。Join、Aggregate等操作符都需要借助Shuffle操作符，确保相同数据分发到同一机器或Instance中，才可以进行Join、Aggregate操作。

5729 0 0

少杰

|

SQL 分布式计算算法

|

博文

SQL优化器原理 - Join重排

这是MaxCompute有关SQL优化器原理的系列文章之一。我们会陆续推出SQL优化器有关优化规则和框架的其他文章。添加钉钉群“关系代数优化技术”（群号11719083）可以获取最新文章发布动态。本文的目标是解释Join重排这个特性的基础概念和算法，如果想快速了解并在MaxCompute上使用这个特性，请直接跳到“总结”。

12836 1 4

隐林

|

数据采集分布式计算监控

|

博文

基于阿里云数加MaxCompute的企业大数据仓库架构建设思路

数加大数据直播系列课程主要以基于阿里云数加MaxCompute的企业大数据仓库架构建设思路为主题分享阿里巴巴的大数据是怎么演变以及怎样利用大数据技术构建企业级大数据平台。本次分享嘉宾是来自阿里云大数据的技术专家祎休背景与总体思路数据仓库是一个面向主题的、集成的、非易失的、反映历史变化的数据集合用于支持管理决策。

10624 1 1

百遇

|

分布式计算监控大数据

|

博文

阿里云「MaxCompute最佳实践」征文大赛获奖文章公布

在征文阶段，共有近44个企业和开发者提交了上云实践现文章，经过广大网友的投票以及专家评审团的打分，结果公布如下。

4462 0 0

大数据计算 MaxCompute

最新

博文

全部内容

免费试用

问答

电子书

学习

体验

视频

活动

MaxCompute2.0助力众安保险快速成长

MaxCompute 2.0 基于BigBench标准的最新测试进展

MaxCompute2.0索引优化实践

Installation and Operation Guide for BigBench on MaxCompute Benchmarking Suite

MaxCompute - ODPS重装上阵 第一弹 - 善用MaxCompute编译器的错误和警告

MaxCompute - ODPS重装上阵 第二弹 - 新的基本数据类型与内建函数

MaxCompute - ODPS重装上阵 第三弹 - 复杂类型

10月18日，德国法兰克福，阿里云MaxCompute2.0，全面布局AI人工智能

Breakthrough in Alibaba Cloud Computing Capabilities - BigBench Reaches 100 TB World Record

MaxCompute Studio 2.8.1 新版本发布啦！

赋能数据处理能力 阿里云MaxCompute助企业洞察市场

阿里云与Apache Flink商业公司DataArtisans于2017杭州云栖大会达成战略合作并发布

[干货]作为大数据入门者，你不得不知道的2017杭州云栖大会

MaxCompute执行作业慢的原因排查

阿里云计算能力实现多项突破 BigBench规模全球首次被拓展至100TB

CloudSort 阿里云 2016 夺冠，性价比高出 AWS 保持的世界记录三倍

阿里云全新一代企业级新品解读—通过MaxCompute Studio实践大数据时代的DevOps

MaxCompute常用语句汇总(更新ing)

仁人帮探索大数据技术

用炸弹开路——加速到来的证券投资行业人工智能时代

2017云栖大会·杭州峰会：《在线用户行为分析：基于流式计算的数据处理及应用》之《流数据处理：通过StreamSQL分析视频日志》篇

2017云栖大会·杭州峰会：《在线用户行为分析：基于流式计算的数据处理及应用》之《流数据采集：海量流式视频日志收集》篇

2017云栖大会·杭州峰会：《在线用户行为分析：基于流式计算的数据处理及应用》实验环境准备

2017云栖大会·杭州峰会：《在线用户行为分析：基于流式计算的数据处理及应用》Workshop-入口

阿里云MaxCompute澳大利亚开服，“领跑”人工智能市场

从未停止进化的MaxCompute

MaxCompute SQL原理解析及性能调优

阿里云机器学习平台的思考

比自建 Hadoop 还便宜！云栖大会揭秘阿里云数加 MaxCompute

阿里云MaxCompute香港开服 引入更多人工智能

iphoneX都面世了，你的数据仓库还停留在诺基亚时代吗?

阿里巴巴下一代数据集成技术

1次演讲13次提到技术，马云在阿里巴巴年会上都说了什么？

阿里数据仓库实践分享

MaxCompute常见错误汇总（更新ing）

阿里巴巴MaxCompute亮相VLDB2017

DT时代已经悄然来临，IT人您跟上了吗？

SQL优化器原理-Metadata

美柚与MaxCompute数据同步架构说明

阿里云大数据计算服务MaxCompute（原ODPS）华南1（深圳）Region即将开服！

odps之sql性能优化

数据智能需求旺盛 阿里云MaxCompute 2.0华南区开服

IDEA集成MaxCompute

阿里云大数据利器之-RDS迁移到Maxcompute实现动态分区

机器学习系列直播--使用对抗神经网络(GANs)生成猫【8月30日 20点不见不散】

SQL优化器原理 - Auto Hash Join

SQL优化器原理－Shuffle优化

SQL优化器原理 - Join重排

基于阿里云数加MaxCompute的企业大数据仓库架构建设思路

阿里云「MaxCompute最佳实践」征文大赛获奖文章公布

活跃用户

相关产品

MaxCompute - ODPS重装上阵　第一弹 - 善用MaxCompute编译器的错误和警告

MaxCompute - ODPS重装上阵　第二弹 - 新的基本数据类型与内建函数

MaxCompute - ODPS重装上阵　第三弹 - 复杂类型

赋能数据处理能力阿里云MaxCompute助企业洞察市场

阿里云MaxCompute香港开服引入更多人工智能

数据智能需求旺盛阿里云MaxCompute 2.0华南区开服