网站流量日志埋点收集 --方案一-基本功能数据采集实现|学习笔记-阿里云开发者社区

网站流量日志埋点收集 --方案一-基本功能数据采集实现|学习笔记

2022-11-23 587

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习网站流量日志埋点收集--方案一-基本功能数据采集实现

开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战（第一阶段）：网站流量日志埋点收集--方案一-基本功能数据采集实现】学习笔记，与课程紧密联系，让用户快速学习知识。

课程地址：https://developer.aliyun.com/learning/course/693/detail/12181

网站流量日志埋点收集--方案一-基本功能数据采集实现

内容简介

一、基本功能实现

二、相关演示操作

接下来我们学习自定义埋点采集数据的具体实现。首先学习我们的方案一：基本功能的实现，也就是说我们之前所梳理的这一套逻辑，到底能不能落实到我们的现实层面当中。

一、基本功能实现

打开参考资料软件下的网站流量日志自定义采集服务，里面打开参考文档里的采集方案一，这里我们简单模拟了首页进行数据收集，结合我们之前所讲理论打开查看是否有不同之处。

首先打开 index.html 页面，内容不多，但重点是写入了埋点代码（图中灰色部分），埋点代码中主要是匿名函数自调用的逻辑，只要用户打开页面，匿名函数就会自调用并且执行一次。在执行过程中创建 script 标签，把我们收集数据的js拉取到页面上开始执行。

接下来看 ma.js,这个 js 是真正用于收集数据的 js。只不过没有把它写死在页面上，而是把它提取出变成单独的文件。整体(function() 一个小括号里面定义一个没有名字的函数是匿名函数，第二个小括号表示对前面的函数立即调用自己一次，相当于匿名函数调用，再通过解析内置对象属性拼接成参数发往后端。

第三块是 nginx.conf，就是 nginx 配置文件，当中重点是 server 中 location 模块。这里定义了两个 location，一个是 location/log.gif,和前面图片发送的资源可以对应，里面生成了 cookie，生成了图片，并且把我们的参数内部跳转给 location/i-log，所以另一个是 location/i-log。

在这里我们还定义了自己的格式，叫做 user_log_format,这里我们格式是以||来分隔数据。

以上就是整个方案一的三个文件，当中的重点是一定要确定资源的路径位于哪台机器上。