助力工业物联网,工业大数据之DWD层构建:数据抽取分析【十一】

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 助力工业物联网,工业大数据之DWD层构建:数据抽取分析【十一】

知识点18:DWD层构建:数据抽取分析

  • 目标实现DWD层的构建思路分析
  • 路径
  • step1:抽取目标
  • step2:抽取语法
  • 实施
  • 抽取目标:将ODS层中每张表的数据抽取到DWD层对应的数据表中
  • 抽取语法
insert overwrite table dwd.tbname partition(dt = '20210101')
select
  字段1,
  字段2,
  字段3,
  ……
from ods.tbname
where dt = '20210101';
  • 小结
  • 实现DWD层的构建思路分析

知识点19:DWD层构建:数据抽取测试

  • 目标实现DWD层数据抽取的测试
  • 路径
  • step1:代码讲解
  • step2:代码测试
  • 实施
  • 代码讲解
  • step1:如何获取所有表名?
  • 所有表名都在list中
  • step2:如何获取所有字段的信息?
  • 从Oracle中获取
  • 代码测试
  • 取消第6段代码的注释
  • 运行代码,查看结果
  • 小结
  • 实现DWD层数据抽取的测试

知识点20:整体代码重难点回顾

  • 目标掌握整体代码的重难点
  • 实施
  • 问题1:怎么读取表名的?
  • 表名:文件
  • FileUitil:读取文件
  • TableNameUtil:将表名拆分全量列表和增量列表
  • 问题2:怎么构建连接的?
  • Oracle:cx_Oracle
  • conn(hostname,port,username,password,sid)
  • Hive/SparkSQL:PyHive
  • conn(hostname,port,username,password)
  • 执行SQL规则
  • step1:必须构建一个连接
  • step2:从连接中获取游标,定义SQL
  • step3:使用游标执行SQL语句
  • step4:释放资源
  • 问题3:为什么要把连接地址写在文件里?
  • 开发规范
  • df.write.jdbc(url,table,properties)
  • 地址
  • 端口
  • 用户名
  • 密码
  • 表名
  • 问题4:怎么拼接SQL语句的?
  • 字符串的拼接
  • 问题5:怎么执行SQL语句的?
  • 游标:execute(SQL)
  • 问题6:怎么获取Oracle的表的信息的?
  • Oracle将每张表的每一列的信息都存储Oracle系统表中
  • 通过SQL就可以查询到表的这些信息
  • TableMeta:表的信息
  • 表名:String
  • 表的注释:String
  • 列的信息:List[ColumnMeta]
  • ColumnMeta:列的信息
  • 列名
  • 列注释
  • 列类型
  • 长度
  • 精度
  • 小结
  • 掌握整体代码的重难点


相关实践学习
钉钉群中如何接收IoT温控器数据告警通知
本实验主要介绍如何将温控器设备以MQTT协议接入IoT物联网平台,通过云产品流转到函数计算FC,调用钉钉群机器人API,实时推送温湿度消息到钉钉群。
阿里云AIoT物联网开发实战
本课程将由物联网专家带你熟悉阿里云AIoT物联网领域全套云产品,7天轻松搭建基于Arduino的端到端物联网场景应用。 开始学习前,请先开通下方两个云产品,让学习更流畅: IoT物联网平台:https://iot.console.aliyun.com/ LinkWAN物联网络管理平台:https://linkwan.console.aliyun.com/service-open
目录
相关文章
|
17天前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
63 2
|
6天前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
23 4
|
8天前
|
机器学习/深度学习 分布式计算 算法
【大数据分析&机器学习】分布式机器学习
本文主要介绍分布式机器学习基础知识,并介绍主流的分布式机器学习框架,结合实例介绍一些机器学习算法。
59 5
|
20天前
|
存储 监控 数据挖掘
【Clikhouse 探秘】ClickHouse 物化视图:加速大数据分析的新利器
ClickHouse 的物化视图是一种特殊表,通过预先计算并存储查询结果,显著提高查询性能,减少资源消耗,适用于实时报表、日志分析、用户行为分析、金融数据分析和物联网数据分析等场景。物化视图的创建、数据插入、更新和一致性保证通过事务机制实现。
81 14
|
16天前
|
人工智能 监控 物联网
深度探索人工智能与物联网的融合:构建未来智能生态系统###
在当今这个数据驱动的时代,人工智能(AI)与物联网(IoT)的深度融合正引领着一场前所未有的技术革命。本文旨在深入剖析这一融合背后的技术原理、探讨其在不同领域的应用实例及面临的挑战与机遇,为读者描绘一幅关于未来智能生态系统的宏伟蓝图。通过技术创新的视角,我们不仅揭示了AI与IoT结合的强大潜力,也展望了它们如何共同塑造一个更加高效、可持续且互联的世界。 ###
|
18天前
|
传感器 安全 算法
物联网发布者在数据传输过程中如何防止数据被篡改
在物联网数据传输中,为防止数据被篡改,可采用加密技术、数字签名、数据完整性校验等方法,确保数据的完整性和安全性。
|
18天前
|
存储 安全 算法
物联网发布者在发送数据时如何保证数据的安全性和完整性
数据加密、密钥管理和数据完整性验证是物联网安全的重要组成部分。对称加密(如AES)和非对称加密(如RSA)分别适用于大量数据和高安全需求的场景。密钥需安全存储并定期更新。数据完整性通过MAC(如HMAC-SHA256)和数字签名(如RSA签名)验证。通信协议如MQTT over TLS/SSL和CoAP over DTLS增强传输安全,确保数据在传输过程中的机密性和完整性。
|
25天前
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
73 2
|
26天前
|
数据采集 机器学习/深度学习 搜索推荐
大数据与社交媒体:用户行为分析
【10月更文挑战第31天】在数字化时代,社交媒体成为人们生活的重要部分,大数据技术的发展使其用户行为分析成为企业理解用户需求、优化产品设计和提升用户体验的关键手段。本文探讨了大数据在社交媒体用户行为分析中的应用,包括用户画像构建、情感分析、行为路径分析和社交网络分析,以及面临的挑战与机遇。
|
25天前
|
传感器 监控 安全
创新无限:物联网技术在智慧城市构建中的前沿探索
【10月更文挑战第29天】在这个信息爆炸的时代,物联网(IoT)技术正重塑我们对城市的认知。智慧城市已从科幻走向现实,物联网通过连接各种设备和传感器,收集、分析数据,提升城市运行效率和居民生活质量。从智慧城管、智能交通、智慧水务到智能电网,物联网的应用正逐步实现城市的智能化、互联化和可持续发展。
45 1