使用SLS统计分析三方CDN回源OSS月95带宽实践

本文涉及的产品
对象存储 OSS,20GB 3个月
日志服务 SLS,月写入数据量 50GB 1个月
.cn 域名,1个 12个月
简介: 本文介绍通过使用阿里云日志服务SLS,对存储在SLS中的三方CDN回源阿里云OSS的监控日志数据,进行自定义查询分析之后得到按照不同运营商、不同业务类型(CND)纬度下,回源OSS的带宽月95量级数据,用于业务统计分析。

1. SLS介绍

日志服务SLS是云原生观测与分析平台,为Log、Metric、Trace等数据提供大规模、低成本、实时的平台化服务。日志服务一站式提供数据采集、加工、查询与分析、可视化、告警、消费与投递等功能,全面提升研发、运维、运营、安全等场景的数字化能力。

2. 需求场景描述

基于阿里云OSS为源站,并结合三方CDN,可以搭建起对外提供公网的服务。将三方CDN回源阿里云OSS的监控数据存储在日志服务SLS中,需要SLS中获取三方CDN回源OSS的相关监控数据,用于业务统计分析。
相应的监控日志简化样例如下:
image.png
不同业务场景(CDN)、域名和运营商之间的对应关系示例如下:
image.png
具体需求:基于存储在SLS中的三方CDN回源阿里云OSS的监控数据,需要得到按照运营商纬度,来区分不同业务类型(CND)下回源OSS的带宽月95量级数据,用于业务统计分析。

3. SLS解决方案呈现

3.1 前置资源准备

  • 已创建Linux系统ECS服务器
  • 已创建用于存储不同业务场景(CDN)、域名和运营商之间对应关系的CSV格式文件
  • 已创建对象存储OSS,并把CSV文件上传至OSS
  • 已开通SLS服务,创建Project并在该Project下创建Logstore1和Logstore2

3.2 构造模拟日志

为验证基于SLS满足该需求的解决方案可行性,按照日志样例在阿里云Linux服务器上构造模拟日志,在root/usr/local/logs路径下创建cdn.log文件,在文件中输入JSON格式的日志数据如下。
image.png

3.3 Logtail采集日志

在SLS中创建Project,创建Logstore1用来存放采集的Linux服务器模拟日志,Logtail的采集配置如下:日志路径为usr/local/logs/cdn.log,模式为JSON模式。由于构造的模拟日志不是实时产生的,因此在模拟日志接入Logstore1后,需要vim cdn.log打开日志文件编辑并关闭一次之后,数据才会被采集到Logstore1。
image.png
Logstore1中成功采集到的模拟日志数据如下所示:
image.png

3.4 外表数据导入

由于需求是想得到按照运营商纬度,区分不同业务类型(CND)下回源OSS的带宽月95量级数据。因此需要创建一个外表用于存储业务场景(CDN)、域名和运营商之间的对应关系,并把外表数据导入到俞Logstore1相同Project下的Logstore2中,用于跨两个Logstore之间的数据联合查询分析。
首先创建CSV格式文件,用于存储业务场景(CDN)、域名和运营商三者之间的对应关系。并把CSV文件导入到Logstore2中,导入配置中的数据格式选择为CSV。
查询分析配置如下,关闭全文索引。
image.png
Logstore2中查询到的日志数据如下:
image.png

3.5 联合查询分析

通过使用估算函数approx_percentile(x, percentage),对月带宽值进行正序排列,返回大约处于95位置的数值,具体为approx_percentile(get_throughput, 0.95)。
估算函数approx_percentile结合join、group_by、oder_by子句,在Logstore1的查询框里输入如下语句:
image.png
返回如下结果:第一列为不同运营商、第二列为不同业务类型(CDN)、第三列尾运营商纬度下不同业务类型(CDN)的月带宽95量级。
image.png
在统计图表中的运营商列,检索框中输入CMM,即可得到运营商为中国移动情况下,SCDN、TCDN和PCDN三个业务类型下的月带宽95量级数据,从而可满足统计分析的需求。
image.png

4. 解决方案举一反三

若具体需求是想得到按照业务类型(CDN)纬度,区分不同运营商情况下回源OSS的带宽月95量级统计数据。则查询分析的SQL语句修改如下(仅调换字段的顺序即可)。
image.png
返回如下结果:第一列为不同业务类型(CDN)、第二列为不同运营商、第三列尾业务类型(CDN)纬度下不同运营商的月带宽95量级。
image.png
在统计图表中的业务类型列,检索框中输入SCDN,即可得到自建CDN情况下,中国移动、中国电信和中国联通三个运营商的月带宽95量级数据,从而可满足统计分析的需求。
image.png

5. 总结

阿里云SLS支持的SQL语法中的JOIN子句用于连接多个表,支持跨Logstore和MySQL、Logstore和OSS、Logstore和Logstore之间数据的联合查询,以满足不同业务分析统计场景的需求。

目录
相关文章
|
6月前
|
存储 消息中间件 Java
Apache Flink 实践问题之原生TM UI日志问题如何解决
Apache Flink 实践问题之原生TM UI日志问题如何解决
58 1
|
6月前
|
存储 监控 数据库
Django 后端架构开发:高效日志规范与实践
Django 后端架构开发:高效日志规范与实践
112 1
|
17天前
|
存储 监控 安全
网络安全视角:从地域到账号的阿里云日志审计实践
日志审计的必要性在于其能够帮助企业和组织落实法律要求,打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用,一方面是选择国家网络安全专用认证的日志分析产品,另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外,还可通过报表分析和告警配置,主动发现潜在的安全威胁,增强云上资产安全。
|
4月前
|
Rust 前端开发 JavaScript
Tauri 开发实践 — Tauri 日志记录功能开发
本文介绍了如何为 Tauri 应用配置日志记录。Tauri 是一个利用 Web 技术构建桌面应用的框架。文章详细说明了如何在 Rust 和 JavaScript 代码中设置和集成日志记录,并控制日志输出。通过添加 `log` crate 和 Tauri 日志插件,可以轻松实现多平台日志记录,包括控制台输出、Webview 控制台和日志文件。文章还展示了如何调整日志级别以优化输出内容。配置完成后,日志记录功能将显著提升开发体验和程序稳定性。
178 1
Tauri 开发实践 — Tauri 日志记录功能开发
|
10天前
|
存储 运维 监控
金融场景 PB 级大规模日志平台:中信银行信用卡中心从 Elasticsearch 到 Apache Doris 的先进实践
中信银行信用卡中心每日新增日志数据 140 亿条(80TB),全量归档日志量超 40PB,早期基于 Elasticsearch 构建的日志云平台,面临存储成本高、实时写入性能差、文本检索慢以及日志分析能力不足等问题。因此使用 Apache Doris 替换 Elasticsearch,实现资源投入降低 50%、查询速度提升 2~4 倍,同时显著提高了运维效率。
金融场景 PB 级大规模日志平台:中信银行信用卡中心从 Elasticsearch 到 Apache Doris 的先进实践
|
2月前
|
存储 数据采集 监控
云上数据安全保护:敏感日志扫描与脱敏实践详解
随着企业对云服务的广泛应用,数据安全成为重要课题。通过对云上数据进行敏感数据扫描和保护,可以有效提升企业或组织的数据安全。本文主要基于阿里云的数据安全中心数据识别功能进行深入实践探索。通过对商品购买日志的模拟,分析了如何使用阿里云的工具对日志数据进行识别、脱敏(3 种模式)处理和基于 StoreView 的查询脱敏方式,从而在保障数据安全的同时满足业务需求。通过这些实践,企业可以有效降低数据泄漏风险,提升数据治理能力和系统安全性。
369 10
云上数据安全保护:敏感日志扫描与脱敏实践详解
|
2月前
|
存储 人工智能 开发工具
AI场景下的对象存储OSS数据管理实践
本文介绍了对象存储(OSS)在AI业务中的应用与实践。内容涵盖四个方面:1) 对象存储作为AI数据基石,因其低成本和高弹性成为云上数据存储首选;2) AI场景下的对象存储实践方案,包括数据获取、预处理、训练及推理阶段的具体使用方法;3) 国内主要区域的默认吞吐量提升至100Gbps,优化了大数据量下的带宽需求;4) 常用工具介绍,如OSSutil、ossfs、Python SDK等,帮助用户高效管理数据。重点讲解了OSS在AI训练和推理中的性能优化措施,以及不同工具的特点和应用场景。
104 10
|
2月前
|
弹性计算 人工智能 数据管理
AI场景下的对象存储OSS数据管理实践
本文介绍了ECS和OSS的操作流程,分为两大部分。第一部分详细讲解了ECS的登录、密码重置、安全组设置及OSSUTIL工具的安装与配置,通过实验创建并管理存储桶,上传下载文件,确保资源及时释放。第二部分则聚焦于OSSFS工具的应用,演示如何将对象存储挂载为磁盘,进行大文件加载与模型训练,强调环境搭建(如Conda环境)及依赖安装步骤,确保实验结束后正确清理AccessKey和相关资源。整个过程注重操作细节与安全性,帮助用户高效利用云资源完成实验任务。
99 10
|
2月前
|
存储 监控 安全
网络安全视角:从地域到账号的阿里云日志审计实践
日志审计的必要性在于其能够帮助企业和组织落实法律要求,打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用,一方面是选择国家网络安全专用认证的日志分析产品,另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外,还可通过报表分析和告警配置,主动发现潜在的安全威胁,增强云上资产安全。
|
17天前
|
存储 人工智能 数据管理
云端问道17期方案教学-AI场景下的对象存储OSS数据管理实践
本文介绍了AI场景下的对象存储OSS数据管理实践,由阿里云技术专家明锦分享。主要内容分为两部分:1) AI场景下对象存储实践方案,包括对象存储的应用、优势及在模型推理中的优化;2) OSS常用工具介绍,如OSSFS、Python SDK、Go SDK等,并详细说明了这些工具的特点和使用场景。文中还探讨了不同模式下的性能优化,以及即将推出的OS Connector for AI/ML工具,旨在提升数据下载速度和IO性能。