性能对转化率影响评估方法

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 性能对转化率影响评估方法

1. 背景

业内已经有丰富的数据证明快速的网页浏览及操作体验对转化率等业务指标有明显的促进作用:

A. Google found out that slowing search results by just 4/10ths of a second would
reduce the number of searches by 8,000,000 per day.

B. You have 5 seconds to engage a customer before they leave your web site.

C. For every 1 second speed improvement to the Amazon website conversions increased +2%

....

AE有面向全世界的用户,这些用户处在参差不齐的网络环境中,且由于跨洲际访问机房的天然的物理距离也会使得AE的用户性能体验无法与淘宝这样内贸网站相提并论。在这种情况下,一方面由于AE性能优化空间更大,对转化率提升的空间也更大;另一这方面由于用户环境的千差万别,以及天然距离,使得AE性能优化的投入成本也会非常距大,比如AE可能需要建立区域机房就近服务于用户才能解决性能问题。

如何精确量化性能回报(即量化性能优化带来的转化率提升最终带来GMV的提升),从而精确计算投入产出比,是AE性能优化工作的前提。业内虽然有较多数据证明性能与转化的关系,但在精确衡量投入产出时,每个网站都是不同的无可比性,且很多数据结果由于数据不足够充分也只能定性不能定量。

基于阿里巴巴ODPS的大数据处理能力的优势,AE性能优化小组@桑植、@跑者、@阿四、@子伟、@冯嘉、@涛明、@震羽、@验钞提出并实现了大数据时代的度量方法,通过采集真实用户访问AE网站的性能Latency数据,以及真实的转化率数据,实现最精确的性能转化度量。

目前这一度量还在内部测试调优过程,且已经在内部性能优化中使用,待稳定成熟后,希望能够贡献出来,让集团内部的用户使用起来。

2. 目标

1)通过大数据的采集、计算、分析,验证性能与转化率等业务指标的关系

2)通过大数据的方法,量化性能对转化率的影响

3)做出通用可复制、业务无关的方案,提供给更多有此类需求的同学使用

3. 方案

3.1 基本思路

_
1)浏览器异步执行JS,JS调用Navigation timing API获取当前页面各阶段Latency,并将Latency数据及当前页面唯一标识ID、当前用户Cookie_id异步发送打点服务器

2)打点服务器通过TT将数据导入ODPS

3)ODPS中按Latency分组,将各请求样本分到其Latency所对应的组中

3)将PV数据按上下游链接关系关联起来,从而计算转化率

4)分别计算各组中样本转化率

5)最终得出曲线,是在页面功能及业务状态基础上,各Latency范转内的转化率趋势

3.2 关键技术要素

A. 浏览器Navigation-timing和Resource-timing API是方案得以实施的关键技术基础,API由W3C在2012年底提出,它可以让我们获取到页面各个重要的Latency数据

B. ODPS及相关大数据附属技术产品的的开放性、易用性、处理能力使得方案得以顺利实施

3.3 实现细节及相关SQL这里暂不详细介绍,欢迎线下交流

3.4 量化性能优化带来的转化率提升

1)已经计算出性能区间内的转化率

2)统计所有样本在各性能区间内的分布,得出各性能区间的样本占比

3)将优化后的样本在性能区间内的占比乘以所在性能区间的转化率,得出A

4)将优化前的样本在性能区间内的占比乘以所在性能区间的转化率,得出B

5)B-A即得出性能优化所带来的转化率提升

通过一段时间的观察,在大的样本集下,性能与转化率曲线保持稳定。

4. 结果

_
图中为真实的AE某一分站的搜索数据,柱状图为各性能区间的样本占比,黑色线为各性能区域的转化率,绿色线为各性能区间的跳出率

5. 常见Q&A

Q1:如何排除性能外的业务因素对转化的影响?

A1:此方案单纯的是按性能进行分组统计,在大的样本下,我们可以假定各性能区间内的业务条件是等同的,因此可以不考虑业务因素的影响。当然,还需要更多的时间去证明

Q2:当业务因素变化时,会使得各性能区间内的转化数据发生变化,一般会提升,那如何随时时间去衡量性能带来的转化提升?

A2:每次度量时,以时间最接近的曲线为主,按3.4的方法进行计算。后续会按需看是否采用线性回归,按自然时间上的表现拟合出一条曲线,这样可以去除掉某一天的波动

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
8月前
|
机器学习/深度学习 监控
大模型开发:你如何在保持模型性能的同时减少过拟合的风险?
为应对大模型过拟合,采用正则化(L1/L2/Dropout)、早期停止训练以监控验证集性能,通过数据增强提升模型泛化能力,选择适合问题复杂度的模型,使用集成方法(如Bagging/Boosting)增强稳定性,以及利用预训练模型进行迁移学习。这些策略结合使用能有效降低过拟合风险,提高模型泛化性能。
335 2
|
算法 数据挖掘 数据库
priori 算法的影响因素分析| 学习笔记
快速学习 priori 算法的影响因素分析。
priori 算法的影响因素分析| 学习笔记
|
2月前
|
关系型数据库 Serverless 测试技术
评估特定业务场景下扩缩容操作对性能的影响的方法
通过以上多种方法的综合运用,可以较为全面、准确地评估特定业务场景下扩缩容操作对 PolarDB Serverless 性能的影响。这有助于制定合理的扩缩容策略,确保业务系统在不同资源配置下都能保持良好的性能表现,满足业务需求。
23 1
|
3月前
|
存储 监控 网络协议
服务器压力测试是一种评估系统在极端条件下的表现和稳定性的技术
【10月更文挑战第11天】服务器压力测试是一种评估系统在极端条件下的表现和稳定性的技术
164 32
|
2月前
|
数据采集 缓存 测试技术
性能测试中,除了迭代次数,还有哪些因素会影响测试结果?
性能测试中,除了迭代次数,还有哪些因素会影响测试结果?
42 2
|
2月前
|
自然语言处理 前端开发
如何评估一个基于MLM的模型在特定任务上的性能?
如何评估一个基于MLM的模型在特定任务上的性能?
|
8月前
|
监控 测试技术
“我就优化了下,影响不大的”
“我就优化了下,影响不大的”
41 0
|
8月前
|
人工智能 监控 安全
大模型安全风险的具体表现
【1月更文挑战第23天】大模型安全风险的具体表现
323 3
大模型安全风险的具体表现
|
8月前
|
测试技术
影响性能测试的因素有哪些?
影响性能测试的因素有哪些?
110 0
|
机器学习/深度学习 计算机视觉 数据可视化
YOLOv5改进系列(0)——重要性能指标、训练结果评价及分析、影响mAP指标的因素、优化mAP的方法
YOLOv5改进系列(0)——重要性能指标、训练结果评价及分析、影响mAP指标的因素、优化mAP的方法
7374 0

热门文章

最新文章