大数据计算 MaxCompute-博文-第20页-阿里云开发者社区-阿里云

貌似大部分人在遇到报错的时候，都懒得用翻译软件翻译报错信息，一般直接抛出来问，甚至连报错信息都懒得复制，直接截图出来。所以这里特地总结了一下，最近一段时间有人经常在群里问到的报错信息。 ODPS-0130252:Cartesian product is not allowed “不允许笛卡尔积”主要是为了防止用户误操作，不小心漏了关联条件，造成大量的资源的耗费。

10134 0 1

晋恒

分布式计算大数据调度

博文

【8.23更新--技术干货全家桶】大数据计算技术共享计划 — MaxCompute技术公开课第二季

5月底MaxCompute开启大数据计算技术共享计划，第一季，为大数据爱好者和企业客户带来了MaxCompute数据开发实战的四次主题分享，有1500多名用户线上参加了共享季直播。7月24日，MaxCompute开启第二季技术公开课，近6000名大数据爱好者和企业客户参加了第二季的5次主题直播，越来越多的大数据专家、技术牛人、爱好者参与到我们的技术共享活动中来，让我们一起玩大数据如烹小鲜吧。

7410 0 2

晋恒

人工智能安全算法

博文

当大数据邂逅酷暑，谁的热度更高？— 大数据计算杭州峰会圆满落幕

今夏，什么最热？世界杯。。。除了世界杯还有什么热？杭州的天气。。。当杭州酷暑遇上大数据，哪个更热？先不答，往下看。众所周知，计算的价值绝不止于计算本身，而是让不会说话的数据发声。从玛雅历法到圆周率，从万有引力定律到二进制，从固化的物体到虚拟的思维都由数据注入。

3241 0 0

勿烦

SQL 数据库 HIVE

博文

SQL优化器原理 - 查询优化器综述

本文主要是对数据库查询优化器的一个综述，包括查询优化器分类、查询优化器执行过程和CBO框架Calcite。

11601 1 2

隐林

分布式计算监控搜索推荐

博文

MaxCompute帮你五步实现用户画像的数据加工

6588 0 2

晋恒

SQL 分布式计算大数据

博文

MaxCompute全表扫描新功能，给你“失误”的机会

MaxCompute提供了在不修改代码的前提下，在MapReduce或自定义函数（UDF）代码中，通过某个固定的资源名读取不同资源（数据）的需求。

2876 0 1

隐林

机器学习/深度学习分布式计算语音技术

博文

重磅！MaxCompute助力阿里开源自研语音识别模型DFSMN，准确率高达96.04%

阿里开源语音识别模型DFSMN 在近期举行的云栖大会武汉峰会上，装有DFSMN语音识别模型的“AI收银员”在与真人店员的PK中，在嘈杂环境下准确识别了用户的语音点单，在短短49秒内点了34杯咖啡。此外，装备这一语音识别技术的自动售票机也已在上海地铁“上岗”。

3421 0 0

隐林

消息中间件分布式计算 Kafka

博文

基于MaxCompute构建Noxmobi全球化精准营销系统

摘要：大数据计算服务(MaxCompute，原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案。MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型，能够更快速的解决用户海量数据计算问题，有效降低企业成本，并保障数据安全。

5826 0 0

隐林

SQL 分布式计算大数据

博文

最好用的工兵铲—MaxCompute Studio，来了解下！

摘要：在大数据计算北京高端峰会上，阿里云计算平台高级专家薛明深入介绍了阿里巴巴大数据计算平台开发利器—MaxCompute Studio。一站式的 IDE，可以快速完成数据浏览和管理、进行基于 SQL 和 UDF 的数据开发，更具备完善的作业分析和优化辅助等功能。

5238 0 0

隐林

存储分布式计算算法

博文

MaxCompute在阿里妈妈数据字化营销解决方案上的典型应用

摘要大数据计算服务MaxCompute是一种快速、完全托管的 GB/TB/PB 级数据仓库解决方案目前已在阿里巴巴内部得到大规模应用。来自阿里妈妈基础平台大规模数据处理技术专家向大家分享了MaxCompute在阿里妈妈数据字化营销解决方案上的典型应用经验。

5527 0 0

隐林

SQL 分布式计算安全

博文

MaxCompute产品最新进展 -- 从马力到计算力

摘要本文从马力作为功率衡量标准为切入点介绍了大数据领域的计算力衡量标准TPCBB以及MaxCompute2.0在Big Bench上的卓越表现。同时详细地分享了取得优异成绩背后的产品在最新有哪些进展帮助大家全面的了解MaxCumpute2.0。

4008 0 0

晋恒

SQL Web App开发分布式计算

博文

阿里云MaxCompute 2018-5月刊

5月，MaxCompute提供全表扫描的设置操作，可允许或禁止全表扫描；支持OSS上的Hive文件格式；支持OSS压缩格式GZIP。。。更多新功能新体验，欢迎阅读本文了解。

3177 0 0

康羽

JSON 分布式计算监控

博文

阿里云大数据MaxCompute基于UDTF解析JSON日志的案例

因为MaxCompute提供的系统函数有限，所以平台提供了强大的自定义函数(UDF)来进行复杂的数据处理，因为MaxCompute的沙箱机制，所以解析JSON日志串的时候需要使用GSON来进行解析，本例中原始数据可能是从其他DB通过数据集成同步到MaxCompute平台上的，所以MaxComput.

2470 0 0

liukaitj

分布式计算 Java DataX

博文

MaxCompute读取分析OSS非结构化数据的实践经验总结

1. 本文背景很多行业的信息系统中，例如金融行业的信息系统，相当多的数据交互工作是通过传统的文本文件进行交互的。此外，很多系统的业务日志和系统日志由于各种原因并没有进入ELK之类的日志分析系统，也是以文本文件的形式存在的。

3456 0 0

晋恒

分布式计算大数据 MaxCompute

博文

“帮助企业做好MaxCompute成本优化的实践” 主题分享 6月21日 18:30不见不散

在这个初夏，MaxCompute与大数据开发者们共同开启 “因计算，共成长” 分享季。第一季《MaxCompute开发实战，爽爽不油腻》，共四次主题分享，每周二 18:30-19:00 “MaxCompute开发者交流钉钉群” 在这里等你。

2896 0 0

隐林

存储分布式计算 Java

博文

如何在MaxCompute上处理存储在OSS上的开源格式数据

4040 0 0

晋恒

分布式计算大数据 MaxCompute

博文

MaxCompute携手ofo小黄车与阿里妈妈—邀你共赴大数据计算北京高端峰会（含技术干货整理）

ofo小黄车如何通过MaxCompute轻松处理每天千万订单，提升线下运营效率50%以上，提升整体运行效率76%？阿里妈妈在搜索广告、定向广告、达摩盘、报表和BI分析等常见场景下是如何使用MaxCompute的？ Noxmobi自建业界领先的DSP、SSP、ADX等广告系统，其中最重要的底层数.

4412 0 0

隐林

存储分布式计算大数据

博文

MaxCompute助力OSS支持EB级计算力

一、 MaxCompute是什么你的OSS数据是否作堆积在一旁沉睡已久存储成本变为企业负担你是否想唤醒沉睡的数据驱动你的业务前行MaxCompute可以帮助你高效且低成本的解决这些问题通过对海量数据进行分析和计算来实现勾勒用户画像、提升营销转化、挖掘产品优化方向、预测业务发展等丰富的业务场景。

5043 0 0

隐林

SQL 分布式计算 DataWorks

博文

DataWorks支持PyODPS类型任务

昨天，DataWorks推出了PYODPS任务类型，集成了Maxcompute的Python SDK，可在DataWorks的PYODPS节点上直接编辑Python代码操作Maxcompute，也可以设置调度任务来处理数据，提高数据开发效率。

7014 0 1

隐林

存储分布式计算数据处理

博文

MaxCompute(ODPS)上处理非结构化数据的Best Practice

随着MaxCompute（ODPS）2.0的上线，新增的非结构化数据处理框架也推出一系列的介绍文章，包括 MaxCompute上如何访问OSS数据, 基本功能用法和整体介绍，侧重介绍读取OSS数据进行计算处理；本文：MaxCompute(ODPS)上处理非结构化数据的Best Practice。

5257 0 1

晋恒

SQL 人工智能分布式计算

博文

Meet MaxCompute: The AI Platform Bringing Big Data Analysis to the Masses

2617 0 0

晋恒

SQL 分布式计算 Hadoop

博文

Optimizing Complex Data Distribution in MaxCompute

For a long time, data distribution has been an issue in the field of Big Data processing. Unfortunately, the Big Data processing systems that are popular today do not satisfactorily solve the issue.

2011 0 0

隐林

分布式计算关系型数据库测试技术

博文

DRDS到MaxCompute（原ODPS）数据归档性能优化测试

3223 0 0

晋恒

人工智能分布式计算大数据

博文

全球云端数据仓库领导者 MaxCompute 将于本月10日正式开服美东节点

作为全球云端数据仓库的领导者，阿里云MaxCompute为满足更多客户的业务需求，不断加快全球化部署的节奏。本月10日，美东（弗吉尼亚）节点会正式上线。届时，将会以最新版本产品向用户提供大数据计算资源和能力

2891 0 0

隐林

SQL 分布式计算 DataWorks

博文

为了让开发者写MaxCompute SQL更爽，DataWorks 增强SQL 编辑器功能

众所周知，数据开发和分析的同学每天都要花大量时间写MaxCompute SQL；Dataworks作为数据开发的IDE直接影响着大家的开发效率，这次新上线的Dataworks我们在编辑体验上做了很多工作，在前端实现MaxCompute SQL和编辑器参数等扩展语法的AST解析，并实现更好更智能的代

6517 0 1

晋恒

人工智能分布式计算大数据

博文

全新一代人工智能计算引擎MaxCompute杭州开服，强化阿里云大数据能力，比肩谷歌微软

3月22日，阿里云将正式开服售卖华东1（杭州）节点的大数据计算服务MaxCompute，以进一步提升对华东区域客户服务的响应速度，推动杭州大数据、人工智能产业的加速发展。

3751 0 1

隐林

分布式计算大数据 MaxCompute

博文

中国唯一，阿里云进入Forrester大数据服务榜单

日前，全球权威调研机构Forrester发布《2018年一季度云端数据仓库》报告。报告对大数据服务商的主要功能、区域表现、细分市场和典型客户等进行了全面评估，最终AWS、阿里云、Google、微软四大巨头杀入全球一线阵营。

6173 0 0

祎休

分布式计算搜索推荐 OLAP

博文

基于MaxCompute构建企业用户画像（用户标签的制作）

在数据化营销时代，数据的价值越发显得更为珍贵。那如何让自己的数据发挥价值，也就是说如何让公司沉睡的数据能够驱动业务发展给公司带来商业价值？在营销里面我们都谈精准营销，谈用户画像，那用户画像到底如何构建，用户的标签如何开发？本示例给与最简单的demo，那个大家清楚认识基于MaxCompute如何构建企业用户标签。

9190 0 1

隐林

存储关系型数据库监控

博文

释放存储与计算压力，MySQL用户升级到EB级数据仓库MaxCompute攻略

在过去三年里产生的数据量比以往四万年的数据量还要大。大数据可以来自方方面面，从日常生活购物到社交网络，从地理位置定位到在线视频都会有大量的数据。云计算的蓬勃发展，进一步催生了大数据的价值。廉价的存储和计算，高效的海量数据处理，我们已经进入了“大数据时代”。

5583 0 0

金融豆豆

SQL 分布式计算监控

博文

MaxCompute JOIN优化小结

5131 0 0

隐林

分布式计算 DataWorks 测试技术

博文

如何通过Dataworks禁止MaxCompute 子账号跨Project访问

之前有很多DataWorks用户问MaxCompute访问权限问题，比如子账号为什么可以增删查别人在别的项目创建的表，即使这个子账号并没有加入那个项目。今天手把手教大家实现子账号授权并关闭跨Project的数据访问权限。

3858 0 1

晋恒

分布式计算安全大数据

博文

数据保护伞—为MaxCompute平台数据安全保驾护航

数据安全是大数据发展道路上的重要挑战之一，数据，作为企业的核心资产，80%以上的核心信息是以结构化数据存储，包含个人身份证号、银行账号、电话、客户数据、医疗、交易、薪资等极其重要又敏感的信息。一旦发生数据篡改、盗取、滥用等安全事件，将给企业带来经济和声誉上的双重打击，造成的后果将不堪设想。

9505 0 1

晋恒

关系型数据库 MySQL 数据库

博文

解析DataWorks数据集成中测试连通性失败问题

大家好，这里和大家分享的是DataWorks数据集成中测试连通性失败的排查思路。与测试连通性成功与否的相关因素有很多，本文按照多个因素逐步排查，最终解决问题，希望大家以后再遇到此类问题，请参考此文，相信能够顺利解决您的问题。

5171 0 0

传学

SQL 分布式计算 DataWorks

博文

离线计算中的幂等和DataWorks中的相关事项

概念幂等这个词在软件研发中经常被提到。比如消息发送时不应该同时给同个用户推送多次相同的消息，针对同一笔交易的付款也不应该在重试过程中扣多次钱。曾见过一个案例，有个对于一个单据的确认模块没有考虑到幂等性，导致对应的单据有两条确认记录。

3672 0 4

隐林

分布式计算监控 BI

博文

基于阿里云MaxCompute实现游戏数据运营

一、总览一个游戏/系统的业务数据分析，总体可以分为图示的几个关键步骤： 1、数据采集：通过SDK埋点或者服务端的方式获取业务数据，并通过分布式日志收集系统，将各个服务器中的数据收集起来并送到指定的地方去，比如HDFS等；（注：本文Demo中，使用flume，也可选用logstash、Flue.

5032 0 0

隐林

SQL 分布式计算大数据

博文

邀您参与阿里云MaxCompute2.0最佳实践征文活动

DT时代，越来越多的企业应用数据步入云端。与传统Hadoop相比，阿里云大数据计算服务MaxCompute(原名ODPS)向用户提供了完善的数据导入方案以及多种经典的分布式计算模型，能够更快速的解决用户海量数据计算问题，有效降低企业成本，并保障数据安全。

3143 0 0

隐林

分布式计算资源调度安全

博文

从单租户IaaS到多租户PaaS——金融级别大数据平台MaxCompute的多租户隔离实践

摘要：在2017年云栖大会•北京峰会的大数据专场中，来自阿里云的高级技术专家李雪峰带来了主题为《金融级别大数据平台的多租户隔离实践》的演讲。在分享中，李雪峰首先介绍了基于传统IaaS单租户架构做隔离时面临的问题；然后，他重点分享了MaxCompute PaaS层面的多租户的架构以及MaxCompute在安全隔离方面的具体实践。

12314 0 0

隐林

分布式计算搜索推荐大数据

博文

基于MaxCompute搭建社交好友推荐系统

摘要：本次由阿里云驻云科技资深架构师翟永东带来了“基于MaxCompute搭建社交好友推荐系统”为主题的分享，主要对大数据在好友推荐系统中的应用、好友推荐系统的分析模型、好友推荐系统在阿里云上的实现方式和MaxCompute技术进行了精彩的介绍。

3944 0 0

晋恒

分布式计算 MaxCompute

博文

Alibaba Cloud MaxCompute to Be Available in Indonesia Which Will Serve as the 12th Global Data Region

On February 9, 2018, Alibaba Cloud MaxCompute will be officially available in Jakarta. By then, Indonesia will be the 12th region in MaxCompute global.

2707 0 0

晋恒

SQL 分布式计算大数据

博文