阿里云 MaxCompute 2022-7月刊

简介: 本刊为您带来 2022年7月 MaxCompute 产品最新动态及精彩活动回顾。

本刊为您带来 2022年7月 MaxCompute 产品最新动态。


7月产品发布新动态


1. MaxCompute 新增6个Bit和Map相关的聚合函数  查看文档  >>


适用客户

  • 数据开发者/BI报表开发者/数据分析师等


发布功能

新增以下6个聚合函数,可以对输入的Bit值或者Map对象做聚合操作,使数据分析统计更加便捷:BITWISE_OR_AGG / MAP_AGG / MULTIMAP_AGG / MAP_UNION / MAP_UNION_SUM / HISTOGRAM。


2. MaxCompute 新增3个窗口函数,并对已有窗口函数进行了性能调优  查看文档  >>


适用客户

  • 数据开发者/BI报表开发者/数据分析师等


发布功能

新增first_value / last_value / nth_value三个窗口函数,并对已有窗口函数做性能调优,性能大幅提升。


3. MaxCompute 支持在表级别设置split size参数  查看文档  >>


适用客户

  • 数据开发者/BI报表开发者/数据分析师等


发布功能

MaxCompute 支持在表级别设置split size来控制并发度,当用户发现资源较充足且作业运行较慢,或者作业等待资源时间较长且资源不足时,可以通过调整该参数来提升计算效率。


4. MaxCompute 支持Unload函数导出数据时自定义文件名前后缀  查看文档  >>


适用客户

  • 数据开发者/BI报表开发者/数据分析师等


发布功能

MaxCompute 支持用户使用Unload函数从MaxCompute导出数据到OSS时,自定义导出数据文件名的前缀和后缀。


5. MaxCompute 新增正则函数regexp_extract_all 查看文档  >>


适用客户

  • 数据开发者/BI报表开发者/数据分析师等


发布功能

MaxCompute 新增正则函数regexp_extract_all,用户可用该函数一次性从需要处理的字符串中匹配所有满足要求的子字符串,并以数组方式返回,以提高数据处理效率。



7月活动回顾


【公开课】2022阿里云大数据公开课第一季 — 云原生一体化数仓产品新能力解读


第一讲 《阿里云云原生一体化数仓 — 离线实时一体化新能力解读

直播回放 >>

阅读文章 >>


第二讲 《阿里云云原生一体化数仓 — 分析服务一体化新能力解读

直播回放 >>

阅读文章 >>


第三讲 《阿里云云原生一体化数仓 — 数据建模新能力解读

直播回放 >>

阅读文章 >>


第四讲 阿里云云原生一体化数仓 — 数据治理新能力解读

直播回放 >>

阅读文章 >>


第五讲 阿里云云原生一体化数仓 — 湖仓一体新能力解读

直播回放 >>

阅读文章 >>



近期产品月刊回顾


阿里云 MaxCompute 2022-6月刊 >>

阿里云 MaxCompute 2022-4月5月刊合集 >>

阿里云 MaxCompute 2022-03 月刊 >>

阿里云 MaxCompute 2022-1月2月刊合集 >>


相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
13天前
|
分布式计算 大数据 BI
MaxCompute产品使用合集之MaxCompute项目的数据是否可以被接入到阿里云的Quick BI中
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
13天前
|
分布式计算 大数据 MaxCompute
MaxCompute产品使用合集之使用pyodps读取OSS(阿里云对象存储)中的文件的步骤是什么
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
13天前
|
分布式计算 DataWorks Java
DataWorks产品使用合集之阿里云DataWorks专有云环境下,上传MaxCompute的UDF(用户自定义函数)的JAR包的步骤如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
22 0
|
13天前
|
SQL 分布式计算 DataWorks
MaxCompute产品使用合集之阿里云MaxCompute对SQL语句的长度的长度限制是多少
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
1月前
|
机器学习/深度学习 分布式计算 数据挖掘
阿里云 MaxCompute MaxFrame 开启免费邀测,统一 Python 开发生态
阿里云 MaxCompute MaxFrame 正式开启邀测,统一 Python 开发生态,打破大数据及 AI 开发使用边界。
734 1
|
13天前
|
SQL 分布式计算 大数据
MaxCompute产品使用合集之怎样可以将大数据计算MaxCompute表的数据可以导出为本地文件
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
13天前
|
分布式计算 DataWorks 关系型数据库
MaxCompute产品使用合集之可以使用什么方法将MySQL的数据实时同步到MaxCompute
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
12天前
|
分布式计算 DataWorks 数据库
DataWorks操作报错合集之DataWorks使用数据集成整库全增量同步oceanbase数据到odps的时候,遇到报错,该怎么处理
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
24 0
|
12天前
|
分布式计算 DataWorks 关系型数据库
DataWorks产品使用合集之在 DataWorks 中,使用Oracle作为数据源进行数据映射和查询,如何更改数据源为MaxCompute或其他类型
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
27 1
|
12天前
|
分布式计算 DataWorks 调度
DataWorks产品使用合集之在DataWorks中,查看ODPS表的OSS对象如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
28 1

热门文章

最新文章

相关产品

  • 云原生大数据计算服务 MaxCompute