大数据计算 MaxCompute-博文-第13页-阿里云开发者社区-阿里云

龙青云

|

SQL 分布式计算调度

|

博文

使用AirFlow调度MaxCompute

airflow是Airbnb开源的一个用python编写的调度工具，基于有向无环图(DAG)，airflow可以定义一组有依赖的任务，按照依赖依次执行，通过python代码定义子任务，并支持各种Operate操作器，灵活性大，能满足用户的各种需求。本文主要介绍使用Airflow的python Operator调度MaxCompute 任务

1140 0 1

龙青云

|

SQL 分布式计算 Java

|

博文

Kettle是一款开源的ETL工具，纯java实现，可以运行于Windows, Unix, Linux上运行，提供图形化的操作界面，可以通过拖拽控件的方式，方便地定义数据传输的拓扑。Kettle支持丰富的数据输入输出源，数据库支持Oracle，MySql，DB2等，也支持业界各种开源的大数据系统，例如HDFS, HBase, Cassandra, MongoDB等。本文将介绍如何利用MaxCompute的插件无缝对接阿里云的大数据计算平台——MaxCompute。

1693 1 1

晋恒

|

SQL 分布式计算大数据

|

博文

阿里云 MaxCompute 2021-7 月刊

MaxCompute 7月刊将带您了解7月最新发布的项目删除、SQL性能优化推荐等功能以及7月、8月精彩直播课程，欢迎阅读。

1547 0 0

木弈

|

域名解析分布式计算网络协议

|

博文

MaxCompute跨境访问加速解决方案

MaxCompute联合全球加速服务，为有跨境访问需求的MaxCompute客户提供一套高效稳定的跨境访问加速方案。

1500 0 0

亢海鹏

|

SQL 分布式计算资源调度

|

博文

外部工具连接SaaS模式云数仓MaxCompute 实战—— 数据库管理工具篇

本次直播将主要分享MaxCompute查询加速功能、数据库管理工具DBeaver、DataGrip、SQL Workbench/J的部分连接演示。

2023 0 0

亢海鹏

|

SQL 分布式计算数据可视化

|

博文

外部工具连接SaaS模式云数据仓库MaxCompute实战——BI分析工具篇

MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库，以 Serverless 架构提供快速、全托管的在线数据仓库服务，消除了传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，帮助企业和大数据开发者经济并高效的分析处理海量数据。

2275 1 1

晋恒

|

分布式计算 Cloud Native 大数据

|

博文

2021阿里巴巴大数据技术公开课第一季 — 外部工具连接SaaS模式云数仓MaxCompute实战

MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库，以 Serverless 架构提供快速、全托管的在线数据仓库服务，消除了传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，帮助企业和大数据开发者经济并高效的分析处理海量数据。

1025 0 1

亢海鹏

|

传感器 SQL 分布式计算

|

博文

MaxCompute Spark 资源使用优化详解

本文主要讲解MaxCompute Spark资源调优，目的在于在保证Spark任务正常运行的前提下，指导用户更好地对Spark作业资源使用进行优化，极大化利用资源，降低成本。

2702 0 4

晋恒

|

SQL 分布式计算监控

|

博文

阿里云 MaxCompute 2021年4-6月刊合集

本次月刊合集包含 MaxCompute 近期功能发布及商业化动态，更推荐10篇技术及实践文章供产品用户阅读了解。

1181 0 0

龙青云

|

SQL 资源调度分布式计算

|

博文

MaxCompute中如何通过logview诊断慢作业

MaxCompute致力于批量结构化数据的存储和计算，提供海量数据仓库的解决方案及分析建模服务，在MaxCompute执行sql任务的时候有时候作业会很慢，本文通过查看logview排查具体任务慢的原因

5443 0 0

暮角

|

SQL 分布式计算 Java

|

博文

MaxCompute 挑战使用SQL进行序列数据处理

MaxCompute 挑战使用SQL进行序列数据处理 --而不是用MR和函数

3071 1 4

暮角

|

存储 SQL 移动开发

|

博文

Maxcompute造数据-方法详解

造一点模拟数据的方法

4407 0 0

游客ykfym5dqgv3xk

|

分布式计算 MaxCompute 开发工具

|

博文

【文档小窍门】填写用户反馈的正确姿势

在使用产品帮助文档过程中，遇到问题了？更加困惑了？莫慌，手把手教你如何摆好填写用户反馈的正确姿势，助力文档更好地为您服务~~~

1204 0 0

耿江涛

|

SQL 分布式计算 Java

|

博文

UDF精简使用大全

在MaxCompute开发过程中，开发同学遇到的的一些复杂逻辑该如何处理，如何在MaxCompute开发不同场景下的UDF函数？带着这个问题，本文针对UDF的各方面内容做出介绍，其中涉及UDF对应不同语言的类型映射关系、以及对应UDF在重载、访问网络、引用表与资源、以及第三方包的使用为大家做出展示。

6782 0 0

张雅静

|

存储分布式计算 MaxCompute

|

博文

使用MaxCompute LOAD命令批量导入OSS数据最佳实践—STS方式LOAD开启KMS加密OSS数据

MaxCompute使用load overwrite或load into命令将外部存储的数据（如：oss）导入到MaxCompute前的授权操作。

1359 0 0

晋恒

|

存储分布式计算 Cloud Native

|

博文

数仓架构的持续演进与发展 — 云原生、湖仓一体、离线实时一体、SaaS模式

数据仓库概念从1990年提出，经过了四个主要阶段。从最初的数据库演进到数据仓库，到MPP架构，到大数据时代的数据仓库，再到今天的云原生的数据仓库。在不断的演进过程中，数据仓库面临着不同的挑战。

3048 0 0

亢海鹏

|

存储 SQL 分布式计算

|

博文

如何基于MaxCompute快速打通数据仓库和数据湖的湖仓一体实践

MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库，以 Serverless 架构提供快速、全托管的在线数据仓库服务，消除了传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您可以经济并高效的分析处理海量数据。数以万计的企业正基于 MaxCompute 进行数据计算与分析，将数据高效转换为业务洞察。

2378 0 0

亢海鹏

|

机器学习/深度学习人工智能分布式计算

|

博文

MaxCompute 产品相关电子书合集（欢迎大家下载阅读~）

MaxCompute （原odps）是面向分析的企业级SaaS模式云数据仓库，以Serverless架构提供全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入。MaxCompute支持多种经典计算模型（批处理、机器学习、交互式分析等）和完善的企业管理功能，借助MaxCompute，用户可轻松集成和管理企业数据资产，简化数据平台架构，加速价值实现。

952 0 0

龙青云

|

存储分布式计算大数据

|

博文

MaxCompute非事务表如何更新数据

本文主要讲解如何通过insert overwrite更新数据

2390 0 0

晋恒

|

SQL 分布式计算 Java

|

博文

[JDBC] Kettle on MaxCompute 使用指南

Kettle是一款开源的ETL工具，纯Java实现，可以在Windows、Unix和Linux上运行，提供图形化的操作界面，可以通过拖拽控件的方式，方便地定义数据传输的拓扑。基本讲介绍基于Kettle的MaxCompute插件实现数据上云。

3780 0 2

耿江涛

|

SQL 分布式计算运维

|

博文

Azkaban业务流程如何转化为DataWorks业务流程

用户在迁移上云的时候，需要将云下的的Azkaban任务迁移上云，之前通过用户在DataWroks一步步创建对应的业务流程，其转化难度和转化时间都是一定的成本和时间，但如何能做到省时省力的方式迁移,为此本文提供了使用迁移助手解决业务流程上云迁移的的问题，本文模拟Azkaban业务流程到入到DataWorks的操作过程，方便大家参阅。

1731 0 0

孟硕(千澍)

|

存储机器学习/深度学习 SQL

|

博文

深入解读：获得 2021 Forrester 全球云数仓卓越表现者的阿里云数据仓库

阿里云在最新发布的 The Forrester Wave™: Cloud Data Warehouse, Q1 2021 全球云数据仓库技术评比中进入卓越表现者象限，成为国内唯一入选厂商。本文针对 Forrester 的报告，结合阿里云的以 MaxCompute 为核心的云数仓产品，做一个详细的技术解读。

1926 0 0

晋恒

|

SQL JSON 分布式计算

|

博文

阿里云 MaxCompute 2021-3 月刊

2021年3月，MaxCompute管家等多项功能上新，快来一起看看吧。

1909 0 0

游客ykfym5dqgv3xk

|

分布式计算 DataWorks 大数据

|

博文

文档搜索So easy

本文为您介绍如何通过阿里云官网提供的搜索入口快速检索产品帮助文档。

1481 0 0

晋恒

|

机器学习/深度学习 SQL 弹性计算

|

博文

国内唯一，阿里云挺进 Forrester 全球云数据仓库卓越表现者象限

阿里云凭借产品现有能力、产品战略、市场表现三项优势，进入Forrester Wave 2021 Q1云数据仓库卓越表现者象限，成为入选此次评测的唯一中国厂商，并由竞争者象限跃升至卓越表现者象限。

1842 0 0

QQ_Now

|

SQL 分布式计算 DataWorks

|

博文

使用MaxCompute连接访问Hologres开发实践

很多客户使用MaxCompute和Hologres的集成方案同时满足大规模离线分析、实时运营分析、交互式查询及在线Serving等多业务场景。MaxCompute和Hologres之间支持相互读写对方数据，能够消除不必要的数据冗余，形成有效的数据分层并支持离线/实时统一视图和联合分析。本文重点介绍了MaxCompute如何访问Hologres数据的开发实践。

4259 1 2

亢海鹏

|

SQL 存储分布式计算

|

博文

MaxCompute产品消费相关文章合集

MaxCompute （原odps）是面向分析的企业级SaaS模式云数据仓库，以Serverless架构提供全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入。MaxCompute支持多种经典计算模型（批处理、机器学习、交互式分析等）和完善的企业管理功能，借助MaxCompute，用户可轻松集成和管理企业数据资产，简化数据平台架构，加速价值实现。

1096 0 0

海清

|

SQL 分布式计算运维

|

博文

MaxCompute作业日常监控与运维实践

2114 0 0

龙青云

|

SQL 分布式计算运维

|

博文

PyODPS如何确定运行在服务端还是客户端

本文主要讲解编写PyODPS代码时如何确定运行在服务端还是客户端

4869 0 0

孙金城

|

存储算法 NoSQL

|

博文

No.1-时序数据库随笔 - Time Series DBMS 综述

这是一篇无法一口气读完的、文字过万[正文字数14390]的长文，这是一个无法中途不上厕所就看完的、关于时序数据库的视频[时长111分钟]分享的文字整理..

2681 0 0

孙金城

|

机器学习/深度学习分布式计算运维

|

博文

阿里云2021春招-通用计算平台实习生招聘ING...

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。阿里云机器学习和大数据分别进入IDC和Forrester领导者象限。

1208 0 0

张雅静

|

分布式计算监控 DataWorks

|

博文

MaxCompute在电商场景中如何进行漏斗模型分析

本文以某电商案例为例，通过案例为您介绍如何使用离线计算并制作漏斗图。

4358 0 0

晋恒

|

SQL 机器学习/深度学习存储

|

博文

阿里云 MaxCompute 2021-2 月刊

2021年2月，MaxCompute发布云数仓内的机器学习 MaxCompute SQLML功能，以及MaxCompute湖仓一体OSS数据湖集成方案等15项新功能，欢迎阅读产品2月刊了解新发功能详情。

5091 0 0

亢海鹏

|

SQL 存储分布式计算

|

博文

【转载】一次 MySQL 千万级大表的优化过程

使用阿里云rds for MySQL数据库（就是MySQL5.6版本），有个用户上网记录表6个月的数据量近2000万，保留最近一年的数据量达到4000万，查询速度极慢，日常卡死，严重影响业务。老系统，当时设计系统的人大概是大学没毕业，表设计和SQL语句写的不仅仅是垃圾，简直无法直视。原开发人员都已离职，到我来维护，这就是传说中的维护不了就跑路，然后我就是掉坑的那个！！！

2044 0 0

晋恒

|

存储分布式计算运维

|

博文

阿里云 MaxCompute 2021-1 月刊

2021年1月，SaaS模式云数据仓库MaxCompute存储单价由梯度定价统一下调整为月固定单价，中小规模企业数据仓库存储成本最高降四成。

3811 0 0

亢海鹏

|

SQL 存储分布式计算

|

博文

MaxCompute Tunnel 技术原理及开发实战

MaxCompute（原名ODPS）是一种快速、完全托管的EB级数据仓库解决方案, 致力于批量结构化数据的存储和计算，为用户提供数据仓库的解决方案及分析建模服务。Tunnel是MaxCompute提供的数据传输服务，提供高并发的离线数据上传下载服务，适合于全量数据或历史数据的批量导入, 并且在MaxCompute的客户端工具中，提供对应的命令实现本地文件与服务数据的互通。

7878 0 0

亢海鹏

|

SQL 存储分布式计算

|

博文

MaxCompute消费预警与控制

MaxCompute（原名ODPS）是一种快速、完全托管的EB级数据仓库解决方案, 致力于批量结构化数据的存储和计算，为用户提供数据仓库的解决方案及分析建模服务，以及完善的数据导入方案和多种经典的分布式计算模型，帮助用户轻松完成大数据分析。目前，MaxCompute服务已覆盖全球16个国家和地区，为全球用户提供海量数据存储和计算服务。

3405 0 0

健炜

|

分布式计算 DataWorks 网络协议

|

博文

MaxCompute中实现IPv4和IPv6地址归属地转换

大数据平台的成熟使得更多种类的非结构化、半结构化的数据分析成为可能。其中把IP地址转换为归属地又是极为常见的一种场景。本文将介绍在MaxCompute如何根据IPv4和IPv6地址实现归属地转换。

4312 0 0

晋恒

|

数据采集缓存分布式计算

|

博文

阿里云联合帆软发布企业级BI分析解决方案，解决数据应用难题

MaxCompute 是阿里云提供的云数据仓库服务，服务着数以万计的客户和阿里巴巴集团。MaxCompute 秉持兼容生态的开放技术路线，持续投入产品生态建设。本次将正式发布与帆软FineBI和FineReport官方集成，为双方用户提供更优质的数据分析体验。

3503 0 0

海清

|

SQL 存储分布式计算

|

博文

MaxCompute消费监控最佳实践

MaxCompute计费方式有按量计费和包年包月，其中按量计费若使用不当，比较容易出现预料之外的高额消费产生，本文将结合阿里云提供的相关消费监控以及MaxCompute本身的消费监控/限制功能，介绍如何更好的进行MaxCompute按量计费消费监控和限制，更大程度的避免出现不必要的消费。

2147 0 0

耿江涛

|

SQL 存储分布式计算

|

博文

MaxCompute按量付费业务流程的计量明细统计

本文针对一个公司有多个部门，一个部门又含有多条业务，另外业务流程中可能包含MapReduce、Spark、SQL，但是如何统计其中一条的业务流程的计费信息。针对这一需求，本文采用的方案是：通过计量计费中获取当前所有project的在某一天的计费信息->采用DataWorks的API获取该project的业务流程下的所有nodeID->通过MaxCompute的SDK将数据写入到MaxCompute表中->最后使用SQL统计出一条业务流程的总的计费统计情况。

2372 0 0

暮角

|

分布式计算 MaxCompute

|

博文

MaxCompute 行转列列转行

搜了一下行转列、列转行，除了隐林一篇之外，好像没有了最近在帮助项目组初学者整理初学者文档，刚好用关系型数据库的例子变化实现了一个借鉴：https://developer.aliyun.com/article/40518 供大家参考

4325 0 0

亢海鹏

|

分布式计算 DataWorks Java

|

博文

MaxCompute Spark 使用和常见问题

本文将就MaxCompute Spark开发环境搭建、常用配置、作业迁移注意事项以及常见问题进行深入介绍。

4759 3 3

晋恒

|

SQL 消息中间件分布式计算

|

博文

阿里云 MaxCompute 2020-12 月刊

2020年12月 MaxCompute 在查询加速、流式数据写入、消费限制、实时作业监控、元数据服务方面有最新发布，欢迎通过本月刊了解12月最新发布详情。

2053 0 0

继盛

|

机器学习/深度学习算法数据可视化

|

博文

「直播回顾」Mars应用与最佳实践

本文首先对Mars的概念、功能、优势进行了介绍，随后，对Mars几个典型的应用场景进行介绍，并通过两个Demo展示了在使用Mars后数据科学性能的提升，最后总结了Mars的最佳实践，让使用Mars更高效便捷。

7360 0 0

继盛

|

机器学习/深度学习分布式计算数据可视化

|

博文

「直播回顾」Mars：加速数据科学的新方式

本文从数据科学概念、背景和现状切入，引出加速数据科学的新方式Mars，并介绍了Mars具体能解决的一些问题和背后的逻辑、哲学，同时对Mars整体数据处理流程进行了介绍。

3154 0 0

皓平(张明)

|

SQL 资源调度分布式计算

|

博文

MaxCompute Logview2.0 参数详解与常见问题

Logview 2.0 原理与功能简介，Logview 2.0 分析问题作业讲解

5212 1 1

晋恒

|

分布式计算大数据 MaxCompute

|

博文

2020阿里巴巴大数据技术公开课第五季 — SaaS模式云数据仓库MaxCompute开发实战与常见问题

MaxCompute（原ODPS）作为SaaS模式云数据仓库，以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

1182 0 1

晋恒

|

消息中间件分布式计算运维

|

博文

阿里云 MaxCompute 2020-11 月刊

2020年11月MaxCompute发布支持以RAM角色身份访问使用服务以及支持消息队列Kafka版通过Connector持续导入数据新功能，详情请查看本月刊内容。

5176 0 0

晋恒

|

存储分布式计算 DataWorks

|

博文

玩物得志：效率为王基于DataWorks+MaxCompute+Hologres 构建大数据平台

为了支撑业务的快速发展，玩物得志极少自己造轮子，会大量采用云平台提供的 SaaS、PaaS 服务。比如大数据体系是在阿里云 MaxCompute+DataWorks 框架体系上建设起来。使用了其核心存储、计算等组件，上层的可视化以及业务查询部分，在使用过程中也会有大量的定制化需求，玩物得志在开源方案的基础上进行了一些二次开发。

15762 0 0

大数据计算 MaxCompute

最新

博文

全部内容

免费试用

问答

电子书

学习

体验

视频

活动

使用AirFlow调度MaxCompute

Kettle on MaxCompute使用指南

阿里云 MaxCompute 2021-7 月刊

MaxCompute跨境访问加速解决方案

外部工具连接SaaS模式云数仓MaxCompute 实战—— 数据库管理工具篇

外部工具连接SaaS模式云数据仓库MaxCompute实战——BI分析工具篇

2021阿里巴巴大数据技术公开课第一季 — 外部工具连接SaaS模式云数仓MaxCompute实战

MaxCompute Spark 资源使用优化详解

阿里云 MaxCompute 2021年4-6月刊合集

MaxCompute中如何通过logview诊断慢作业

MaxCompute 挑战使用SQL进行序列数据处理

Maxcompute造数据-方法详解

【文档小窍门】填写用户反馈的正确姿势

UDF精简使用大全

使用MaxCompute LOAD命令批量导入OSS数据最佳实践—STS方式LOAD开启KMS加密OSS数据

数仓架构的持续演进与发展 — 云原生、湖仓一体、离线实时一体、SaaS模式

如何基于MaxCompute快速打通数据仓库和数据湖的湖仓一体实践

MaxCompute 产品相关电子书合集（欢迎大家下载阅读~）

MaxCompute非事务表如何更新数据

[JDBC] Kettle on MaxCompute 使用指南

Azkaban业务流程如何转化为DataWorks业务流程

深入解读：获得 2021 Forrester 全球云数仓卓越表现者的阿里云数据仓库

阿里云 MaxCompute 2021-3 月刊

文档搜索So easy

国内唯一，阿里云挺进 Forrester 全球云数据仓库卓越表现者象限

使用MaxCompute连接访问Hologres开发实践

MaxCompute产品消费相关文章合集

MaxCompute作业日常监控与运维实践

PyODPS如何确定运行在服务端还是客户端

No.1-时序数据库随笔 - Time Series DBMS 综述

阿里云2021春招-通用计算平台实习生招聘ING...

MaxCompute在电商场景中如何进行漏斗模型分析

阿里云 MaxCompute 2021-2 月刊

【转载】一次 MySQL 千万级大表的优化过程

阿里云 MaxCompute 2021-1 月刊

MaxCompute Tunnel 技术原理及开发实战

MaxCompute消费预警与控制

MaxCompute中实现IPv4和IPv6地址归属地转换

阿里云联合帆软发布企业级BI分析解决方案，解决数据应用难题

MaxCompute消费监控最佳实践

MaxCompute按量付费业务流程的计量明细统计

MaxCompute 行转列 列转行

MaxCompute Spark 使用和常见问题

阿里云 MaxCompute 2020-12 月刊

「直播回顾」Mars应用与最佳实践

「直播回顾」Mars：加速数据科学的新方式

MaxCompute Logview2.0 参数详解与常见问题

2020阿里巴巴大数据技术公开课第五季 — SaaS模式云数据仓库MaxCompute开发实战与常见问题

阿里云 MaxCompute 2020-11 月刊

玩物得志：效率为王 基于DataWorks+MaxCompute+Hologres 构建大数据平台

活跃用户

相关产品

MaxCompute 行转列列转行

玩物得志：效率为王基于DataWorks+MaxCompute+Hologres 构建大数据平台