用户画像分析-8

简介: 用户画像分析-8

3. 加工数据

您本步骤将指导您如何通过DataWorks计算和分析已采集的数据。

1、新建三张数据表,分别为数据运营层表(ods_log_info_d)、数据仓库层表(dw_user_info_all_d)和数据产品层表(rpt_user_info_d)。

1)在临时查询页面的左侧导航中,单击 图标。

2)在数据开发页面,选择业务流程>MaxCompute,右键单击,单击新建表

3)在新建表对话框中,表名输入为ods_log_info_d,单击提交

4)在表ods_log_info_d的编辑页面,单击DDL模式

5)在DDL模式对话框中,输入如下创建数据运营层表的建表语句,单击生成表结构


CREATE TABLE IF NOT EXISTS ods_log_info_d (
  ip STRING COMMENT 'ip',
  uid STRING COMMENT 'uid',
  time STRING COMMENT 'timeyyyymmddhh:mi:ss',
  status STRING COMMENT 'status',
  bytes STRING COMMENT 'bytes',
  region STRING COMMENT 'region',
  method STRING COMMENT 'method',
  url STRING COMMENT 'url',
  protocol STRING COMMENT 'protocol',
  referer STRING COMMENT 'referer',
  device STRING COMMENT 'device',
  identity STRING COMMENT 'identity'
)
PARTITIONED BY (
  dt STRING
);

6)在确认操作对话框中,单击确认

7)在表ods_log_info_d的编辑页面,中文名输入为数据运营层表,单击提交到生产环境

8)重复ii~vii步骤,根据如下建表语句,新建dw_user_info_all_d表和rpt_user_info_d表,中文名分别输入为数据仓库层表和数据产品层表,然后单击提交到生产环境

目录
相关文章
|
机器学习/深度学习 自然语言处理
多语言模型在实际应用中有哪些优势和局限性?
多语言模型在实际应用中有哪些优势和局限性?
|
存储 算法
力扣经典150题第二十四题:文本左右对齐
力扣经典150题第二十四题:文本左右对齐
113 0
|
存储 安全 Java
Java一分钟之-Map接口与HashMap详解
【5月更文挑战第10天】Java集合框架中的`Map`接口用于存储唯一键值对,而`HashMap`是其快速实现,基于哈希表支持高效查找、添加和删除。本文介绍了`Map`的核心方法,如`put`、`get`和`remove`,以及`HashMap`的特性:快速访问、无序和非线程安全。讨论了键的唯一性、`equals()`和`hashCode()`的正确实现以及线程安全问题。通过示例展示了基本操作和自定义键的使用,强调理解这些概念对编写健壮代码的重要性。
228 0
|
存储 域名解析 网络协议
Linux网络服务总结,复习看这个很方便(DHCP、FTP、SSH、DNS、NFS、PXE)
Linux网络服务总结,复习看这个很方便(DHCP、FTP、SSH、DNS、NFS、PXE)
517 0
Linux网络服务总结,复习看这个很方便(DHCP、FTP、SSH、DNS、NFS、PXE)
|
存储 安全 JavaScript
安全基础总结
安全基础总结 @Date 2016.06.02 XSS(跨站脚本攻击) 反射型 : 非持久化 交互性 欺骗用户自己去点击链接才能触发XSS代码 存储型 : 持久化 代码是存储在服务器中(文本框,留言里输入Script脚本) 盗窃用户Coo...
1203 0
|
Linux Unix
Linux应用层的定时器Timer使用详解【转】
转自:http://blog.csdn.net/wwwtovvv/article/details/8601528 版权声明:本文为博主原创文章,未经博主允许不得转载。 linux下定时器的使用 -- alarm() & setitimer(): 1、alarm ---------...
1528 0
|
Web App开发 数据采集 Python
Python爬虫之BeautifulSoup
上一篇博文中提到用正则表达式来匹配数据项,但是写起来容易出错,如果有过DOM开发经验或者使用过jQuery的朋友看到BeautifulSoup就像是见到了老朋友一样。
1291 0
|
网络协议 ice
tcpdump 抓包让wireshark来分析
在linux下面用tcpdump 抓包非常方便, 但是抓的包要提取出来进行分析, 还是得用wireshark来过滤分析比较方便。   下面先介绍一下 TCPDUMP 的使用   例:tcpdump host 172.
2105 0