基于SLS与表格存储对电商平台用户行为日志进行加工富化

简介: 网络时代中电商平台在企业和商家的品牌推广、商品和服务销售等环节发挥着日益重要的作用。但随着国内互联网行业人口红利的逐渐消失,电商平台间竞赛逐渐进入了下半场。运营模式和发展战略正不断向精细化、增转存方向转变。

SLS简介

日志服务(Log Service,简称SLS)是云原生观测与分析平台,为Log、Metric、Trace等数据提供大规模、低成本、实时的平台化服务。日志服务一站式提供数据采集、加工、查询与分析、可视化、告警、消费与投递等功能,全面提升您在研发、运维、运营、安全等场景的数字化能力。

数据加工服务是阿里云SLS推出的面向日志ETL处理的服务,主要解决数据加工过程中转换、过滤、分发、富化等场景。数据加工DSL是专门为日志实时行处理定制的一套语言,目前支持200+的行处理函数。随着用户在 SLS 存储的数据越来越多,除了最常见的运维等场景,如何进一步挖掘数据的价值,就成为了下一步的重要目标,这里来通过一个实例说明数据加工DSL中的e_tablestore_map函数如何对电商平台的行为日志进行数据富化。

场景应用

网络时代中电商平台在企业和商家的品牌推广、商品和服务销售等环节发挥着日益重要的作用。但随着国内互联网行业人口红利的逐渐消失,电商平台间竞赛逐渐进入了下半场。运营模式和发展战略正不断向精细化、增转存方向转变。因此,对平台用户的行为进行分析,跟进用户的产品需求,依此来优化产品的推广销售,是一项重要环节。

由于平台用户的行为日志数据量大,且需要实时分析,刚好SLS可以满足这个特点,所以可将用户行为日志存储在Logstore中;而电商平台的商品信息内容比较固定,不会频繁更新,且数据量不会太大,则可以存放在数据表Tablestore中。SLS通过对用户的行为日志进行加工富化,可以实时的分析用户行为、检测系统异常等。

实践案例

Logstore数据导入

这里导入的数据参考阿里巴巴提供的一个淘宝用户行为数据集,日志字段包含用户ID、商品ID、商品类目ID、行为类型(行为包括点击、购买、加购、喜欢)和时间戳,如下:

Tablestore数据

数据表Tablestore中存储平台的商品信息,包含字段:商品IDItemID、商品名称(ProductName)、商品价格(Price)、商品品牌(Brand),实例名为"d00s0dxal11b",表名为"sale_table",如下:

数据加工

使用数据加工的e_tablestore_map函数,通过Logstore日志中的商品ID(ItemID)在商品数据表(sale_table)中查找每个商品ID对应的商品及其价格,如下:

e_tablestore_map(

   ["ItemID"],

   "https://d00s0dxal11b.cn-hangzhou.tablestore.aliyuncs.com",

   "access-key-id",

   "access-key-secret",

   "d00s0dxal11b",

   "sale_table", output_fields=["ProductName","Price"])

加工结果

经过数据加工处理后,结果Logstore中的日志包含原始日志中的用户行为字段和及对应的商品及价格,如下:


其他参考

1、淘宝用户购物行为数据集:https://tianchi.aliyun.com/dataset/649

2、数据加工文档:https://help.aliyun.com/document_detail/125384.html

3、e_tablestore_map函数使用指南:https://help.aliyun.com/document_detail/125489.htm?#section-yn2-qsj-afl


相关实践学习
阿里云表格存储使用教程
表格存储(Table Store)是构建在阿里云飞天分布式系统之上的分布式NoSQL数据存储服务,根据99.99%的高可用以及11个9的数据可靠性的标准设计。表格存储通过数据分片和负载均衡技术,实现数据规模与访问并发上的无缝扩展,提供海量结构化数据的存储和实时访问。 产品详情:https://www.aliyun.com/product/ots
目录
相关文章
|
1月前
|
安全 Linux 网络安全
/var/log/secure日志详解
Linux系统的 `/var/log/secure` 文件记录安全相关消息,包括身份验证和授权尝试。它涵盖用户登录(成功或失败)、`sudo` 使用、账户锁定解锁及其他安全事件和PAM错误。例如,SSH登录成功会显示"Accepted password",失败则显示"Failed password"。查看此文件可使用 `tail -f /var/log/secure`,但通常只有root用户有权访问。
109 4
|
1月前
|
运维 监控 数据可视化
日志服务 HarmonyOS NEXT 日志采集最佳实践
鸿蒙操作系统(HarmonyOS)上的日志服务(SLS)SDK 提供了针对 IoT、移动端到服务端的全场景日志采集、处理和分析能力,旨在满足万物互联时代下应用的多元化设备接入、高效协同和安全可靠运行的需求。
116780 10
|
1月前
|
监控 Linux 网络安全
/var/log/auth.log日志说明
`/var/log/auth.log`是Linux系统记录身份验证和授权事件的日志文件,包括登录尝试、SSH连接、sudo操作等。系统管理员可通过它监控用户登录、检查失败尝试、跟踪SSH活动、查看sudo/su操作及PAM活动。日志内容可能因系统配置而异,可能存在于其他日志文件中。分析这些日志可使用`tail`、`grep`等命令或专用日志分析工具。了解系统和其服务详情有助于提取有用信息。
53 2
|
4天前
|
C++
JNI Log 日志输出
JNI Log 日志输出
13 1
|
5天前
|
存储 运维 大数据
聊聊日志硬扫描,阿里 Log Scan 的设计与实践
泛日志(Log/Trace/Metric)是大数据的重要组成,伴随着每一年业务峰值的新脉冲,日志数据量在快速增长。同时,业务数字化运营、软件可观测性等浪潮又在对日志的存储、计算提出更高的要求。
|
11天前
|
XML Java Maven
Springboot整合与使用log4j2日志框架【详解版】
该文介绍了如何在Spring Boot中切换默认的LogBack日志系统至Log4j2。首先,需要在Maven依赖中排除`spring-boot-starter-logging`并引入`spring-boot-starter-log4j2`。其次,创建`log4j2-spring.xml`配置文件放在`src/main/resources`下,配置包括控制台和文件的日志输出、日志格式和文件切分策略。此外,可通过在不同环境的`application.yml`中指定不同的log4j2配置文件。最后,文章提到通过示例代码解释了日志格式中的各种占位符含义。
|
11天前
|
运维 监控 Go
Golang深入浅出之-Go语言中的日志记录:log与logrus库
【4月更文挑战第27天】本文比较了Go语言中标准库`log`与第三方库`logrus`的日志功能。`log`简单但不支持日志级别配置和多样化格式,而`logrus`提供更丰富的功能,如日志级别控制、自定义格式和钩子。文章指出了使用`logrus`时可能遇到的问题,如全局logger滥用、日志级别设置不当和过度依赖字段,并给出了避免错误的建议,强调理解日志级别、合理利用结构化日志、模块化日志管理和定期审查日志配置的重要性。通过这些实践,开发者能提高应用监控和故障排查能力。
87 1
|
13天前
|
弹性计算 运维 Shell
|
19天前
|
Java
log4j异常日志过滤规则配置
log4j异常日志过滤规则配置
90 0
|
22天前
|
SQL 存储 监控
SLS 查询新范式:使用 SPL 对日志进行交互式探索
像 Unix 命令一样支持多级管道级联,像加工预览一样实时处理查询结果,更便捷的交互,更丰富的算子,更灵活的探索半结构化日志,快来试试使用 SPL 语言查询日志数据吧~
46300 4