开发者社区> 隐林> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

MaxCompute常用语句汇总(更新ing)

简介: 收集一些MaxCompute常用命令。
+关注继续查看

大数据计算服务(MaxCompute,原名ODPS,产品地址:https://www.aliyun.com/product/odps)是一种快速、完全托管的TB/PB级数据仓库解决方案。MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。本文收录了一些MaxCompute常用SQL、MR、Tunnel等语句,帮助您快速了解并使用MaxCompute/ODPS。

创建内部表
CREATE TABLE table_name (name string); 
 
创建内部表,并指定分区字段
CREATE TABLE table_name (name string) PARTITIONED BY (ds string); 

创建内部表,并指定生命周期
CREATE TABLE table_name (name string) 
PARTITIONED BY (ds string) LIFECYCLE 365;

创建内部表,并从其他表导入数据

CREATE TABLE table_name AS SELECT * FROM table_name2 ;


创建内部表,并从其他表复制表结构

CREATE TABLE table_name LIKE table_name2 ;


创建虚拟DUAL表
-- 创建表
CREATE TABLE IF NOT EXISTS dual (
    value BIGINT COMMENT 'value'
)
COMMENT 'dual';

-- 插入一条数据
INSERT OVERWRITE TABLE dual
SELECT COUNT(*)
FROM dual;


创建外部表
CREATE EXTERNAL TABLE IF NOT EXISTS table_name
(
a type,
)
STORED BY 'com.aliyun.odps.CsvStorageHandler' -- (1)
WITH SERDEPROPERTIES (
'odps.properties.rolearn'='acs:ram::1811270634786818:role/aliyunodpsdefaultrole'
) -- (2)
LOCATION 'oss://oss-cn-shanghai-internal.aliyuncs.com/oss-odps-test/Demo/'; -- (3)(4)

创建内部表,并判断是否内布表是否已经存在
CREATE TABLE  IF NOT EXISTS  table_name (name string); 
加了 IF NOT EXISTS ,sql执行的结果总是成功;如果没加,表存在的情况下会返回失败。

显示所有表
SHOW TABLES;

显示部分表
SHOW TABLES LIKE 'yinlin*';

显示表分区
SHOW PARTITIONS <table_name>

表中添加一列 
ALTER TABLE table_name ADD COLUMNS (col_name1 type1)
可以一次增加多个列

添加一列并增加列字段注释
ALTER TABLE table_name ADD COLUMNS (test type COMMENT '测试');

更改表名
ALTER TABLE table_name RENAME TO new_table_name;

删除表
DROP TABLE table_name;

修改列名
ALTER TABLE table_name CHANGE COLUMN old_col_name RENAME TO new_col_name;

删除、修改列记录
1、创建一张表,结果为预期的表结构;

CREATE TABLE table2 (xxx);

2、把数据从原表导入到目标表,可以用SQL,比如:

INSERT OVERWRITE TABLE table2 SELECT * FROM table1;

3、更换表名:

ALTER TABLE table1 RENAME TO table1_bak;

ALTER TABLE table2 RENAME TO table1;

将文件中的数据加载到表中
TUNNEL upload -fd '\t' c:\file.txt table_name;

将表数据导出到文件中
TUNNEL d table_name c:\file.txt;

查看表的描述
DESC table_name; 

按条件查询
SELECT * FROM table_name  WHERE foo='';

统计数据总量

SELECT COUNT(1) FROM table_name;

将一个表的统计结果插入另一个表中
 INSERT OVERWRITE TABLE table_name SELECT a.bar, count(1) FROM table_name a WHERE a.foo > 0 GROUP BY a.bar;


欢迎大家补充...
https://yq.aliyun.com/ask/59888


3d0bf925ff04ddc63c499df7ac1bb482d10999ec

阿里巴巴大数据-玩家社区 https://yq.aliyun.com/teams/6/

---阿里大数据博文,问答,社群,实践,有朋自远方来,不亦说乎……

bba01b493e1c5d904e882b1c380673c6ebe49a98

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
【MaxCompute 常见问题】 安全管理
MaxCompute可以对单个表授权吗? MaxCompute 提供了 ACL(基于对象)、跨项目数据分享和项目数据保护等多种授权方式。我们推荐您优先使用ACL 授权,而非 Policy(基于策略)授权。
197 0
MaxCompute2.0 对开源系统的支持与融合
要:在2017杭州云栖大会阿里云大数据计算服务(MaxCompute)专场上,阿里巴巴高级技术专家李睿博为大家分享了阿里云大数据计算服务MaxCompute对于开源系统的支持和融合,以及在拥抱开源和生态的时候阿里巴巴的技术团队遇到过哪些问题和挑战。
6263 0
【MaxCompute 常见问题】 SQL
请问删除表的所有数据 sql 怎么写? 可以通过删除(DROP)表达到数据删除目的。 非分区表可以通过 TRUNCATE TABLE table_name;语句清空表数据。 分区表可以通过 ALTER TABLE table_name DROP IF EXISTS PARTITION(分区名=‘具体分区值’)删除分区达到删除整个分区数据的目的。
904 0
一款轻量高效的开源运维监控系统——WGCLOUD
WGCLOUD设计思想为新一代极简运维监控系统,提倡快速部署,降低运维学习难度,全自动化运行,无模板和脚本。
312 0
Intent常用使用汇总
方法一:调用默认的短信程序Intent intent = new Intent(Intent.ACTION_VIEW);intent.setType("vnd.android-dir/mms-sms");intent.
1077 0
常用API接口汇总
下面列举了100多个国内常用API接口,并按照 笔记、出行、词典、电商、地图、电影、即时通讯、开发者网站、快递查询、旅游、社交、视频、天气、团队协作、图片与图像处理、外卖、消息推送、音乐、云、语义识别、语音识别、杂志、综合 进行了如下分类。
6219 0
MaxCompute安全管理指南-基础篇
背景及目的 方便和辅助MaxCompute的project owner或安全管理员进行project的日常安全运维,保障数据安全。 MaxCompute有安全模型,DataWorks也有安全模型,当通过DataWorks使用MaxCompute,而DataWorks的安全模型不满足业务安全需求时,合理的将两个安全模型结合使用就尤其重要。
3523 0
MaxCompute安全管理指南-案例篇
通过《MaxCompute安全管理-基础篇》了解到MaxCompute和DataWorks的相关安全模型、两个产品安全方面的关联,以及各种安全操作后,本篇主要给出一些安全管理案例,给安全管理的成员作为参考。
2255 0
MaxCompute-使用分享
MaxCompute(原名ODPS)-使用分享
1176 0
【MaxCompute 常见问题】 准备工作
如果您是第一次使用 MaxCompute 和 DataWorks,请使用阿里云账号登录;如果您需要使用 RAM 子账号登录和创建项目,请根据准备阿里云账号检查账号是否已可用并授权
197 0
+关注
隐林
阿里云大数据产品专家,擅长MaxCompute、机器学习、分布式、可视化、人工智能等大数据领域;
288
文章
38
问答
来源圈子
更多
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。
+ 订阅
相关文档: MaxCompute
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载