用百度和神策做埋点为何 pv 差异很大?

本文涉及的产品
云原生数据库 PolarDB 分布式版,标准版 2核8GB
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
云原生数据库 PolarDB MySQL 版,通用型 2核4GB 50GB
简介: 近期 ClkLog 收到一个客户反馈说我们与百度统计的 PV 数据差异很大。为了验证问题,开发进行了一次对页面浏览量统计的测试。针对同一个 IP 同一个时间的页面浏览量统计发现,百度的统计数据只有一条,而 ClkLog 有十条记录,于是我们展开了问题排查。

近期 ClkLog 收到一个客户反馈说我们与百度统计的 PV 数据差异很大。为了验证问题,开发进行了一次对页面浏览量统计的测试。针对同一个 IP 同一个时间的页面浏览量统计发现,百度的统计数据只有一条,而 ClkLog 有十条记录,于是我们展开了问题排查。

百度统计情况:
image.png

ClkLog统计情况:
image.png

一般来说,统计数据不一致的原因有:客户端埋点不准确、数据分析不正确、统计延迟、服务器崩溃、统计规则不一致等。

通过排查我们发现可能是因为单页应用的统计导致数据有巨大差异。

对单页面应用而言,页面的更新是通过 JavaScript 更新页面内容,不同于传统网站在切换页面时,因为路径的变化,每次加载页面都会重新运行一次对应页面内的代码,因此在对单页应用进行流量统计时,怎样确保在浏览不同的内容时也能准确发出相应的统计请求,是各大埋点平台都会考虑的问题。百度统计和神策埋点都有单页应用的配置项,但是默认是关闭状态,需要手动开启

所以单页应用埋点配置规则决定了页面浏览量的统计结果,极大可能就是页面浏览统计数据差异的原因所在。

ClkLog 是一款基于神策分析 SDK 的用户行分析开源软件,所以它也需要进行单页应用的配置。

以下是为大家摘取的百度与 ClkLog 的单页应用解决方案:

百度解决方案:
image.png

ClkLog解决方案:
image.png
当我们客户端接入埋点 SDK 时,要记得进行单页应用的配置,从而确保统计数据的正确性。

快看看你配置单页应用了吗?

ClkLog 与百度、神策的不同在于,ClkLog 相对比较轻量级,旨在让技术人员可快速在 10 分钟内完成私有化部署

ClkLog 在开源社区版本的基础上同时提供拥有更多高级分析功能的商业版本,可以满足不同业务类型与体量的用户。


结束语.png

小伙伴们快来体验下吧!

相关文章
|
自然语言处理 BI 数据处理
【数据对比】综合分析百度情感分析以及华为情感分析的差异,我有了如下结果
【数据对比】综合分析百度情感分析以及华为情感分析的差异,我有了如下结果
364 0
|
监控 JavaScript 前端开发
百度统计分析埋点最佳实战篇
百度统计分析埋点最佳实战篇
1893 0
百度统计分析埋点最佳实战篇
|
机器学习/深度学习 人工智能 自然语言处理
百度智能云新架构掀开面纱:知识中台成为差异化竞争优势
百度智能云新架构掀开面纱:知识中台成为差异化竞争优势
577 0
百度智能云新架构掀开面纱:知识中台成为差异化竞争优势
|
4月前
|
存储 Kubernetes 容器
百度搜索:蓝易云【Kubernetes使用helm部署NFS Provisioner】
现在,你已经成功使用Helm部署了NFS Provisioner,并且可以在Kubernetes中创建使用NFS存储的PersistentVolumeClaim。
190 10
|
4月前
百度搜索:蓝易云【什么是HTTP长轮询?】
现在,HTTP长轮询逐渐被WebSocket等更高效的实时通信技术所替代,但了解HTTP长轮询仍然有助于理解实时数据推送的基本原理。
113 9
|
4月前
|
移动开发 Shell Linux
百度搜索:蓝易云【Shell错误:/bin/bash^M: bad interpreter: No such file or directory】
将 `your_script.sh`替换为你的脚本文件名。运行此命令后,脚本文件的换行符将被转换为Linux格式,然后就可以在Linux系统上正常执行脚本了。
63 8
|
4月前
百度搜索:蓝易云【ipmitool配置BMC的ip】
以上操作将配置BMC的IP地址为新的值。请注意,操作BMC需要谨慎,确保你对服务器有足够的权限,并且仔细检查新的IP地址、子网掩码和默认网关,以免导致服务器网络失联。
77 7
|
4月前
|
Kubernetes 应用服务中间件 nginx
百度搜索:蓝易云【使用Kubernetes部署Nginx应用教程】
现在,你已经成功在Kubernetes集群上部署了Nginx应用。通过访问Service的外部IP地址,你可以访问Nginx服务。
75 4
|
4月前
|
缓存 网络协议 Linux
百度搜索:蓝易云【解决github push/pull报错443】
通过以上方法,你有望解决GitHub push/pull报错443的问题。如果问题仍然存在,建议检查GitHub的状态页面,看是否有正在维护或故障的情况。
121 3
|
4月前
|
Linux Perl
百度搜索:蓝易云【Linux常用命令awk】
以上仅是awk命令的一些常见用法,它还有许多更复杂的功能和用法,可以根据需要灵活运用。awk在文本处理和数据分析中非常实用,是Linux系统中的一把利器。
45 2