大数据入门与实战-SQL基础教程

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 大数据入门与实战-SQL基础教程

学习资料为:sql基础教程【日】MICK


第1章数据库和SQL


1.SQL书写的基本规则

  • SQL分句以分号结尾
  • SQL语句不区分大小写
  1. 创建数据库


CREATE DATABASE shop;


  1. 创建表


USE shop;
CREATE TABLE shoin(
product_id  CHAR(4) NOT NULL COMMENT "商品id",
product_name VARCHAR(100) NOT NULL COMMENT "商品名称",
product_cate VARCHAR(32) NOT NULL COMMENT "商品分类",
product_price INTEGER COMMENT "销售价格",
product_cost INTEGER COMMENT "进货单价",
register_date DATE COMMENT "登记日期",
PRIMARY KEY (product_id)
);


70.png

  1. 删除表


DROP shop;


  1. 更新表定义
  • 添加列


ALTER TABLE shoin ADD COLUMN product_nickname VARCHAR(50) COMMENT "商品别称";


  • 删除列


ALTER TABLE shoin DROP COLUMN product_nickname;


  1. 插入数据


-- DML:插入数据
INSERT INTO shoin VALUES ('0001','T恤衫','衣服',1000,500,'2009-09-20');
INSERT INTO shoin VALUES ('0002','打孔器','办公用品',500,320,'2009-09-11');
INSERT INTO shoin VALUES ('0003','运动T恤衫','衣服',4000,2800,NULL);
INSERT INTO shoin VALUES ('0004','菜刀','厨房用具',3000,2800,'2009-09-20');
INSERT INTO shoin VALUES ('0005','高压锅','厨房用具',6800,5000,'2009-01-15');
INSERT INTO shoin VALUES ('0006','叉子','厨房用具',500,NULL,'2009-09-20');
INSERT INTO shoin VALUES ('0007','擦菜板','厨房用具',880,790,'2009-04-28');
INSERT INTO shoin VALUES ('0008','圆珠笔','办公用品',100,NULL,'2009-11-11');
COMMIT;


71.png


第2章 查询基础


  1. 列的查询
  • 查询三列


SELECT product_id,product_name,product_cost FROM shoin;


72.png


  • 查询所有列


SELECT * FROM shoin;


  • 设置列的别名


SELECT product_id as id,
             product_name as name,
             product_cost as cost
    FROM shoin;


73.png


  1. 设置常数


74.png



这里不要使用双引号

  1. 删除重复行
  • 对一列使用关键字 DISTINCT


SELECT DISTINCT product_cate 
    FROM shoin;


75.png


  • 对多列使用关键字DISTINCT
  1. 根据where选择数据


SELECT product_name,product_cate
    FROM shoin
 WHERE product_cate = '衣服';


76.png


  1. 注释的书写方法
  • --单行注释
  • /**/多行注释
相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
4月前
|
存储 SQL 监控
数据中台架构解析:湖仓一体的实战设计
在数据量激增的数字化时代,企业面临数据分散、使用效率低等问题。数据中台作为统一管理与应用数据的核心平台,结合湖仓一体架构,打通数据壁垒,实现高效流转与分析。本文详解湖仓一体的设计与落地实践,助力企业构建统一、灵活的数据底座,驱动业务决策与创新。
|
2月前
|
SQL 存储 分布式计算
【万字长文,建议收藏】《高性能ODPS SQL章法》——用古人智慧驾驭大数据战场
本文旨在帮助非专业数据研发但是有高频ODPS使用需求的同学们(如数分、算法、产品等)能够快速上手ODPS查询优化,实现高性能查数看数,避免日常工作中因SQL任务卡壳、失败等情况造成的工作产出delay甚至集群资源稳定性问题。
896 36
【万字长文,建议收藏】《高性能ODPS SQL章法》——用古人智慧驾驭大数据战场
|
6月前
|
存储 SQL 分布式计算
别让你的数据“裸奔”!大数据时代的数据隐私保护实战指南
别让你的数据“裸奔”!大数据时代的数据隐私保护实战指南
285 19
|
5月前
|
人工智能 分布式计算 大数据
大数据≠大样本:基于Spark的特征降维实战(提升10倍训练效率)
本文探讨了大数据场景下降维的核心问题与解决方案,重点分析了“维度灾难”对模型性能的影响及特征冗余的陷阱。通过数学证明与实际案例,揭示高维空间中样本稀疏性问题,并提出基于Spark的分布式降维技术选型与优化策略。文章详细展示了PCA在亿级用户画像中的应用,包括数据准备、核心实现与效果评估,同时深入探讨了协方差矩阵计算与特征值分解的并行优化方法。此外,还介绍了动态维度调整、非线性特征处理及降维与其他AI技术的协同效应,为生产环境提供了最佳实践指南。最终总结出降维的本质与工程实践原则,展望未来发展方向。
260 0
|
4月前
|
数据采集 分布式计算 大数据
不会Python,还敢说搞大数据?一文带你入门大数据编程的“硬核”真相
不会Python,还敢说搞大数据?一文带你入门大数据编程的“硬核”真相
121 1
|
3月前
|
SQL 分布式计算 大数据
SparkSQL 入门指南:小白也能懂的大数据 SQL 处理神器
在大数据处理的领域,SparkSQL 是一种非常强大的工具,它可以让开发人员以 SQL 的方式处理和查询大规模数据集。SparkSQL 集成了 SQL 查询引擎和 Spark 的分布式计算引擎,使得我们可以在分布式环境下执行 SQL 查询,并能利用 Spark 的强大计算能力进行数据分析。
|
5月前
|
SQL 人工智能 分布式计算
别再只会写SQL了!这五个大数据趋势正在悄悄改变行业格局
别再只会写SQL了!这五个大数据趋势正在悄悄改变行业格局
78 0
|
2月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
137 14