性能对转化率影响评估方法

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 性能对转化率影响评估方法

1. 背景

业内已经有丰富的数据证明快速的网页浏览及操作体验对转化率等业务指标有明显的促进作用:

A. Google found out that slowing search results by just 4/10ths of a second would
reduce the number of searches by 8,000,000 per day.

B. You have 5 seconds to engage a customer before they leave your web site.

C. For every 1 second speed improvement to the Amazon website conversions increased +2%

....

AE有面向全世界的用户,这些用户处在参差不齐的网络环境中,且由于跨洲际访问机房的天然的物理距离也会使得AE的用户性能体验无法与淘宝这样内贸网站相提并论。在这种情况下,一方面由于AE性能优化空间更大,对转化率提升的空间也更大;另一这方面由于用户环境的千差万别,以及天然距离,使得AE性能优化的投入成本也会非常距大,比如AE可能需要建立区域机房就近服务于用户才能解决性能问题。

如何精确量化性能回报(即量化性能优化带来的转化率提升最终带来GMV的提升),从而精确计算投入产出比,是AE性能优化工作的前提。业内虽然有较多数据证明性能与转化的关系,但在精确衡量投入产出时,每个网站都是不同的无可比性,且很多数据结果由于数据不足够充分也只能定性不能定量。

基于阿里巴巴ODPS的大数据处理能力的优势,AE性能优化小组@桑植、@跑者、@阿四、@子伟、@冯嘉、@涛明、@震羽、@验钞提出并实现了大数据时代的度量方法,通过采集真实用户访问AE网站的性能Latency数据,以及真实的转化率数据,实现最精确的性能转化度量。

目前这一度量还在内部测试调优过程,且已经在内部性能优化中使用,待稳定成熟后,希望能够贡献出来,让集团内部的用户使用起来。

2. 目标

1)通过大数据的采集、计算、分析,验证性能与转化率等业务指标的关系

2)通过大数据的方法,量化性能对转化率的影响

3)做出通用可复制、业务无关的方案,提供给更多有此类需求的同学使用

3. 方案

3.1 基本思路

_
1)浏览器异步执行JS,JS调用Navigation timing API获取当前页面各阶段Latency,并将Latency数据及当前页面唯一标识ID、当前用户Cookie_id异步发送打点服务器

2)打点服务器通过TT将数据导入ODPS

3)ODPS中按Latency分组,将各请求样本分到其Latency所对应的组中

3)将PV数据按上下游链接关系关联起来,从而计算转化率

4)分别计算各组中样本转化率

5)最终得出曲线,是在页面功能及业务状态基础上,各Latency范转内的转化率趋势

3.2 关键技术要素

A. 浏览器Navigation-timing和Resource-timing API是方案得以实施的关键技术基础,API由W3C在2012年底提出,它可以让我们获取到页面各个重要的Latency数据

B. ODPS及相关大数据附属技术产品的的开放性、易用性、处理能力使得方案得以顺利实施

3.3 实现细节及相关SQL这里暂不详细介绍,欢迎线下交流

3.4 量化性能优化带来的转化率提升

1)已经计算出性能区间内的转化率

2)统计所有样本在各性能区间内的分布,得出各性能区间的样本占比

3)将优化后的样本在性能区间内的占比乘以所在性能区间的转化率,得出A

4)将优化前的样本在性能区间内的占比乘以所在性能区间的转化率,得出B

5)B-A即得出性能优化所带来的转化率提升

通过一段时间的观察,在大的样本集下,性能与转化率曲线保持稳定。

4. 结果

_
图中为真实的AE某一分站的搜索数据,柱状图为各性能区间的样本占比,黑色线为各性能区域的转化率,绿色线为各性能区间的跳出率

5. 常见Q&A

Q1:如何排除性能外的业务因素对转化的影响?

A1:此方案单纯的是按性能进行分组统计,在大的样本下,我们可以假定各性能区间内的业务条件是等同的,因此可以不考虑业务因素的影响。当然,还需要更多的时间去证明

Q2:当业务因素变化时,会使得各性能区间内的转化数据发生变化,一般会提升,那如何随时时间去衡量性能带来的转化提升?

A2:每次度量时,以时间最接近的曲线为主,按3.4的方法进行计算。后续会按需看是否采用线性回归,按自然时间上的表现拟合出一条曲线,这样可以去除掉某一天的波动

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
算法 数据挖掘 数据库
priori 算法的影响因素分析| 学习笔记
快速学习 priori 算法的影响因素分析。
priori 算法的影响因素分析| 学习笔记
|
2月前
|
存储 监控 网络协议
服务器压力测试是一种评估系统在极端条件下的表现和稳定性的技术
【10月更文挑战第11天】服务器压力测试是一种评估系统在极端条件下的表现和稳定性的技术
120 32
|
15天前
|
数据采集 缓存 测试技术
性能测试中,除了迭代次数,还有哪些因素会影响测试结果?
性能测试中,除了迭代次数,还有哪些因素会影响测试结果?
23 2
|
7月前
|
监控 测试技术
“我就优化了下,影响不大的”
“我就优化了下,影响不大的”
36 0
|
7月前
|
测试技术
影响性能测试的因素有哪些?
影响性能测试的因素有哪些?
|
机器学习/深度学习 算法
评估系统或算法质量的重要指标
准确性(Accuracy):衡量系统或算法输出结果与真实结果之间的接近程度。通常使用分类准确率、回归误差等指标来评估。 精确率(Precision)和召回率(Recall):主要用于评估分类模型的性能。精确率衡量预测为正例的样本中实际为正例的比例,召回率衡量实际为正例的样本中被正确预测为正例的比例。
298 4
|
NoSQL 关系型数据库 MySQL
如何评估、预测系统的QPS
如何评估、预测系统的QPS
|
测试技术 微服务
测试质量保障的影响因素
测试质量保障的影响因素
182 0
测试质量保障的影响因素
|
搜索推荐 算法 UED
推荐算法如何影响我们的生活
在生活中,我们经常面对需要决策的问题时,会使用多种策略来帮我们做出决策。诸如“我应该买哪个品牌手机?”,“我应该看哪部电影?”,“中午吃什么好?”等问题。我们做出选择时一般会依赖于朋友的推荐、在线评论、网上搜索和其他方法。 网上购物的兴起只会让这个决策过程变得更加复杂,因为购物者现在面临着更多的选择。互联网让我们从物质匮乏的时代变成了物质丰富的时代! 推荐引擎是帮助我们进行决策的工具。从推荐产品、要观看的电影、微信上的朋友到朋友、要阅读的新闻文章、搜索引擎优化、餐厅等等。在某种程度上,这些算法正在改变我们的决策过程。
221 0
|
机器学习/深度学习 安全
5种常用的交叉验证技术,保证评估模型的稳定性
5种常用的交叉验证技术,保证评估模型的稳定性
380 0
5种常用的交叉验证技术,保证评估模型的稳定性