使用SLS统计分析三方CDN回源OSS月95带宽实践

本文涉及的产品
对象存储 OSS,20GB 3个月
日志服务 SLS,月写入数据量 50GB 1个月
对象存储 OSS,恶意文件检测 1000次 1年
简介: 本文介绍通过使用阿里云日志服务SLS,对存储在SLS中的三方CDN回源阿里云OSS的监控日志数据,进行自定义查询分析之后得到按照不同运营商、不同业务类型(CND)纬度下,回源OSS的带宽月95量级数据,用于业务统计分析。

1. SLS介绍

日志服务SLS是云原生观测与分析平台,为Log、Metric、Trace等数据提供大规模、低成本、实时的平台化服务。日志服务一站式提供数据采集、加工、查询与分析、可视化、告警、消费与投递等功能,全面提升研发、运维、运营、安全等场景的数字化能力。

2. 需求场景描述

基于阿里云OSS为源站,并结合三方CDN,可以搭建起对外提供公网的服务。将三方CDN回源阿里云OSS的监控数据存储在日志服务SLS中,需要SLS中获取三方CDN回源OSS的相关监控数据,用于业务统计分析。
相应的监控日志简化样例如下:
image.png
不同业务场景(CDN)、域名和运营商之间的对应关系示例如下:
image.png
具体需求:基于存储在SLS中的三方CDN回源阿里云OSS的监控数据,需要得到按照运营商纬度,来区分不同业务类型(CND)下回源OSS的带宽月95量级数据,用于业务统计分析。

3. SLS解决方案呈现

3.1 前置资源准备

  • 已创建Linux系统ECS服务器
  • 已创建用于存储不同业务场景(CDN)、域名和运营商之间对应关系的CSV格式文件
  • 已创建对象存储OSS,并把CSV文件上传至OSS
  • 已开通SLS服务,创建Project并在该Project下创建Logstore1和Logstore2

3.2 构造模拟日志

为验证基于SLS满足该需求的解决方案可行性,按照日志样例在阿里云Linux服务器上构造模拟日志,在root/usr/local/logs路径下创建cdn.log文件,在文件中输入JSON格式的日志数据如下。
image.png

3.3 Logtail采集日志

在SLS中创建Project,创建Logstore1用来存放采集的Linux服务器模拟日志,Logtail的采集配置如下:日志路径为usr/local/logs/cdn.log,模式为JSON模式。由于构造的模拟日志不是实时产生的,因此在模拟日志接入Logstore1后,需要vim cdn.log打开日志文件编辑并关闭一次之后,数据才会被采集到Logstore1。
image.png
Logstore1中成功采集到的模拟日志数据如下所示:
image.png

3.4 外表数据导入

由于需求是想得到按照运营商纬度,区分不同业务类型(CND)下回源OSS的带宽月95量级数据。因此需要创建一个外表用于存储业务场景(CDN)、域名和运营商之间的对应关系,并把外表数据导入到俞Logstore1相同Project下的Logstore2中,用于跨两个Logstore之间的数据联合查询分析。
首先创建CSV格式文件,用于存储业务场景(CDN)、域名和运营商三者之间的对应关系。并把CSV文件导入到Logstore2中,导入配置中的数据格式选择为CSV。
查询分析配置如下,关闭全文索引。
image.png
Logstore2中查询到的日志数据如下:
image.png

3.5 联合查询分析

通过使用估算函数approx_percentile(x, percentage),对月带宽值进行正序排列,返回大约处于95位置的数值,具体为approx_percentile(get_throughput, 0.95)。
估算函数approx_percentile结合join、group_by、oder_by子句,在Logstore1的查询框里输入如下语句:
image.png
返回如下结果:第一列为不同运营商、第二列为不同业务类型(CDN)、第三列尾运营商纬度下不同业务类型(CDN)的月带宽95量级。
image.png
在统计图表中的运营商列,检索框中输入CMM,即可得到运营商为中国移动情况下,SCDN、TCDN和PCDN三个业务类型下的月带宽95量级数据,从而可满足统计分析的需求。
image.png

4. 解决方案举一反三

若具体需求是想得到按照业务类型(CDN)纬度,区分不同运营商情况下回源OSS的带宽月95量级统计数据。则查询分析的SQL语句修改如下(仅调换字段的顺序即可)。
image.png
返回如下结果:第一列为不同业务类型(CDN)、第二列为不同运营商、第三列尾业务类型(CDN)纬度下不同运营商的月带宽95量级。
image.png
在统计图表中的业务类型列,检索框中输入SCDN,即可得到自建CDN情况下,中国移动、中国电信和中国联通三个运营商的月带宽95量级数据,从而可满足统计分析的需求。
image.png

5. 总结

阿里云SLS支持的SQL语法中的JOIN子句用于连接多个表,支持跨Logstore和MySQL、Logstore和OSS、Logstore和Logstore之间数据的联合查询,以满足不同业务分析统计场景的需求。

目录
相关文章
|
3月前
|
弹性计算 人工智能 数据管理
AI场景下的对象存储OSS数据管理实践
本文介绍了ECS和OSS的操作流程,分为两大部分。第一部分详细讲解了ECS的登录、密码重置、安全组设置及OSSUTIL工具的安装与配置,通过实验创建并管理存储桶,上传下载文件,确保资源及时释放。第二部分则聚焦于OSSFS工具的应用,演示如何将对象存储挂载为磁盘,进行大文件加载与模型训练,强调环境搭建(如Conda环境)及依赖安装步骤,确保实验结束后正确清理AccessKey和相关资源。整个过程注重操作细节与安全性,帮助用户高效利用云资源完成实验任务。
635 161
|
1月前
|
消息中间件 监控 数据挖掘
【有奖实践】轻量消息队列(原 MNS)订阅 OSS 事件实时处理文件变动
当你需要对对象存储 OSS(Object Storage Service)中的文件变动进行实时处理、同步、监听、业务触发、日志记录等操作时,你可以通过设置 OSS 的事件通知规则,自定义关注的文件,并将 OSS 事件推送到轻量消息队列(原 MNS)的队列或主题中,开发者的服务即可及时收到相关通知,并通过消费消息进行后续的业务处理。
|
1月前
|
消息中间件 对象存储
轻量消息队列(原 MNS)订阅 OSS 事件实践
使用轻量消息队列订阅OSS事件,实时处理文件变动,赢取ins风U型枕(限量500个)。访问活动页面,完成实操并上传截图即可参与领奖。活动时间:即日起至2025年2月28日16:00。奖品数量有限,先到先得,快来报名吧!
|
3月前
|
存储 人工智能 开发工具
AI场景下的对象存储OSS数据管理实践
本文介绍了对象存储(OSS)在AI业务中的应用与实践。内容涵盖四个方面:1) 对象存储作为AI数据基石,因其低成本和高弹性成为云上数据存储首选;2) AI场景下的对象存储实践方案,包括数据获取、预处理、训练及推理阶段的具体使用方法;3) 国内主要区域的默认吞吐量提升至100Gbps,优化了大数据量下的带宽需求;4) 常用工具介绍,如OSSutil、ossfs、Python SDK等,帮助用户高效管理数据。重点讲解了OSS在AI训练和推理中的性能优化措施,以及不同工具的特点和应用场景。
348 10
|
4月前
|
弹性计算 数据管理 应用服务中间件
活动实践 | 借助OSS搭建在线教育视频课程分享网站
本教程指导用户在阿里云ECS实例上搭建在线教育网站,包括重置ECS密码、配置安全组、安装Nginx、创建网站页面、上传数据至OSS、开通OSS传输加速、配置生命周期策略及清理资源等步骤,实现高效、低成本的数据管理和网站运营。
活动实践 | 借助OSS搭建在线教育视频课程分享网站
|
2月前
|
存储 人工智能 数据管理
云端问道17期方案教学-AI场景下的对象存储OSS数据管理实践
本文介绍了AI场景下的对象存储OSS数据管理实践,由阿里云技术专家明锦分享。主要内容分为两部分:1) AI场景下对象存储实践方案,包括对象存储的应用、优势及在模型推理中的优化;2) OSS常用工具介绍,如OSSFS、Python SDK、Go SDK等,并详细说明了这些工具的特点和使用场景。文中还探讨了不同模式下的性能优化,以及即将推出的OS Connector for AI/ML工具,旨在提升数据下载速度和IO性能。
|
5月前
|
存储 人工智能 缓存
AI助理直击要害,从繁复中提炼精华——使用CDN加速访问OSS存储的图片
本案例介绍如何利用AI助理快速实现OSS存储的图片接入CDN,以加速图片访问。通过AI助理提炼关键操作步骤,避免在复杂文档中寻找解决方案。主要步骤包括开通CDN、添加加速域名、配置CNAME等。实测显示,接入CDN后图片加载时间显著缩短,验证了加速效果。此方法大幅提高了操作效率,降低了学习成本。
5566 16
|
5月前
|
JSON API 数据格式
阿里云国际版CDN查询实时带宽步骤
阿里云国际版CDN查询实时带宽步骤
|
6月前
|
存储 监控 数据可视化
SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
【9月更文挑战第2天】SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
251 9
|
10月前
|
SQL 分布式计算 监控
基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
本文演示了使用 EMR Serverless Spark 产品搭建一个日志分析应用的全流程,包括数据开发和生产调度以及交互式查询等场景。
56673 7
基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用