`
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
升级设置说明:
UDF场景更新:
odps.vpc.id
和odps.vpc.access.ips
来指定UDF访问的VPC及IP地址、端口信息。
set odps.vpc.id=vpc_name;
set odps.vpc.access.ips=ip:port;
networklink
参数替代上述两个参数:
set odps.session.networklink=your_networklink_name;
这一更改简化了访问VPC网络资源的流程。
外部表场景更新:
CREATE EXTERNAL TABLE ...
WITH SERDEPROPERTIES (
'odps.external.net.vpc'='true',
'odps.vpc.id'=...,
'odps.vpc.access.ips'=...
);
networklink
参数创建或修改外部表,以实现更便捷的VPC访问配置。
CREATE EXTERNAL TABLE ...
TBLPROPERTIES('networklink'='your_networklink_name');
存量表不受影响,但建议逐步迁移至新配置以保持最佳实践。
GROUPING SETS介绍: GROUPING SETS为GROUP BY
子句提供扩展,允许数据按多种组合方式进行分组,无需写多个SELECT
语句并用UNION ALL
连接,从而提升查询效率和执行性能。
CUBE语法示例: CUBE生成所有列的可能组合作为分组条件。
group by cube (a, b, c);
ROLLUP语法示例: ROLLUP按层级聚合生成分组条件。
group by rollup (a, b, c);
此功能增强了数据分析的灵活性和效率。
参数化视图定义: MaxCompute支持创建接受参数的视图,增强SQL代码的重用性和灵活性。视图可以接收表或变量作为参数,并根据传入参数定制查询行为。
命令格式示例:
CREATE OR REPLACE VIEW view_name (variable_name variable_type)
RETURNS return_variable TABLE (col_name col_type comment col_comment)
AS
SELECT ...;
通过定义视图变量和返回结构,调用者能以更灵活的方式与视图交互,提高数据处理的模块化程度。
窗口函数基础: 窗口函数操作在特定数据集(窗口)上进行,支持ROWS、RANGE、GROUPS类型来界定窗口边界,基于行数、排序值或相同值分组来划分数据范围,极大地丰富了数据分析能力。
确保frame_start始终位于frame_end之前或等于frame_end,以维护逻辑上的连续性。