数据分析之AB testing实战(附Python代码)(一)

简介: 数据分析之AB testing实战(附Python代码)(一)

1、增长黑客

1)前言

 说到AB testing,就不得不说到增长黑客,这个词大约在2015年就引入到中国了,但是在2018年开始火热起来。那么互联网公司想要增加活跃用户、增加收入,现在的产品运营还是采用增长黑客这样一种运营方式,并不是产品经理一拍脑袋就可以想到,或者老板直接拍板决定就可以做到的。大家现在的玩儿法都是“数据驱动”,使用数据驱动方式来帮助运营更好的产品。那什么是“增长黑客”呢?通俗的说就是“树挪死,人挪活”,互联网公司想要成长,想要变成一个巨头,也需要挪一挪、变一变,不断变换自己的产品,升级自己的产品,否则将会在这样一个弱肉强食、竞争激烈的生态中,被干掉。我们有时候会觉得互联网公司就是【融资、烧钱、拉新、融资、烧钱、拉新…上市(倒闭)】这样一个流程,运气好的话就上市了,运气不好的话就倒闭了。但其实很多互联网公司内部,即使是烧钱,烧钱的方式也是有很多讲究的,并不是老板、产品经理或某个总监拍头决策的。



2)运用分析指标框架,驱动互联网产品和运营

 具体可以看看,增长黑客,怎么运用分析指标框架,驱动互联网产品和运营?现在分享一个链接,供大家了解:http://www.woshipm.com/data-analysis/439849.html

image.png

 整个互联网内部,无论是产品、营销、销售等,现在基本都是采用“数据驱动”这样一个方式来进行运作的,这也就是“数据分析行业”在最近几年为什么这么火热的原因。“增长黑客”很多人用AARRR去总结了一下,如上图所示,下面我们来对上图做一个文字说明。

 首选是“获取用户”(Acquisition),怎么样使用一种比较高效的方式(APP、网站、百度或淘宝买一些广告、)来获取到用户,增加用户数。接着是“增加活跃”(Activation),对于获取到的用户,怎么去激活他们,使得他们变得活跃。然后是“提高留存”(Retention),我好不容易通过各种渠道,将用户拉到我的产品中,怎么让他们成为我们这个产品的忠实用户。再接着就是“实现收益”(Revenue),公司运营需要生存,就必须要赚钱获取收益,那么怎么样获取更多的收益?是订阅更多的VIP用户,还是卖给用户更多的产品或者广告来获取收益?最后一个是“裂变传播”(Referral),如果我们前面的过程做的好的话,用户是不是会帮助我们做裂变传播,他们自己会口口相传(微信、朋友圈等),帮助我们做宣传,帮助我们拓展更多的用户。

 这样上述几个部分就形成了一个良好的闭环,不断地去良性的发展。


3)增长黑客大致分为如下几个步骤

image.png

 首先是“分析现状”,分析现在的产品有哪些问题?在哪方面可以提高?

 然后是“设置目标”,你想干什么?像爱奇艺、腾讯视频等,就是想增加VIP的数量;像淘宝的话,如何更多地增加广告收入;像抖音地话,如何增加日活,怎么样让用户每天不停地去刷抖音,这样我会有更多的广告,更多的活跃用户数,更多的收入。

 接着是“提出改进方案”,提出方案后,是不是你的方案就是最优的呢?其实并不是,这就是下面所说的需要进行“小规模测试”。

 再接着是“开始小规模测试”,拿出一部分测试用户,让他们去看是否满意,是不是反馈的比较好。怎么知道反馈的好不好呢?就是下面要说的采集分析。

 再接着是“采集分析”,对测试用户得到的数据进行数据分析,如果反馈效果好,就调整流量,不断扩大规模去测试。如果反馈效果不好,就停止或者是修改方案(回到前面的步骤),这是一个反复迭代的过程,这个过程也就是“AB testing”。

 “AB testing”就是来帮助我们,通过数据分析的方式,来优化增长黑客这样一个流程,使用数据驱动的方式,来帮助分析我们的产品,分析我们的用户反馈。


2、AB testing介绍

1)AB testing对比方案图示展示

图示一:天猫两个网页的改版

image.png

图示二:微信两个版本的改版

image.png

 产品经理改了一个新的版本,那它到底好不好呢?可不可以一拍脑袋说,觉得哪个好就用哪个呢?万一反馈不是很好,万一下降了活跃用户数量,减少了用户收入,其实对于大公司来说,都是巨大的损失,谁都承担不起。所以需要使用像AB testing这样数据分析的方式,去把这个风险降到最低。还有一个例子就是Facebook,他们有一个级别非常高的高管,推动他们的产品,觉得某个产品这么好、那么好,所有Facebook产品的发布和版本的迭代都需要使用AB testing,小范围用户测试的时候,如果发现用户反馈不好,变得不怎么活跃了,觉得非常难用了,即使这个高管再推动呢,也是不行的,必须使用数据说话,这个产品不好,就放弃这个版本,去研发下一个版本或者寻找另外的突破口。这个东西在国内的好多公司基本都是这么玩儿的,比如说上述微信1.0版本和微信2.0版本,也不是说随随便便拍拍脑袋就发给大家使用的,其实也是运用AB testing,很多时候让大家看到不同的页面,找到一部分小流量用户,帮助我们去测试,看看他们的反馈。


2)什么是反馈呢?

 上面很多次我们都提到了“用户反馈”,那么什么是“反馈”呢?其实就是这部分用户的使用时长呀,产生的收益呀,像百度这样的广告(他有没有点广告呀),像爱奇艺这样的付费网站(他有没有从一个普通用户变为一个VIP用户呀),这些指标等都可以验证你新的版本是不是好。


3)如何选取这样一批小流量用户呢?

 最重的就是随机性。我们不能仅仅选择深圳市的某个地方的一些用户,作为测试用户。我们也不能仅仅选择年龄在25-30这样的限定范围的一些用户,作为测试用户。应该是在你的用户中随机抽取比如说1%的用户,作为小流量用户去进行版本测试,看看他们的反馈。如果反馈好,我们考虑扩大流量用户,抽取2%、5%、10%、20%、50%甚至是100%。如果反馈不好,我们选择是终止此次实验,寻找新的突破口,还是选择改进自己的版本。


4)到底什么是AB testing?

 简单地说:确定两个元素或版本(A和B)哪个版本更好!

image.png


5)如何做AB testing?

① 在产品正式迭代发版之前,为同一个目标制定两个(或以上)方案;

提出想法,设定假设;

预估成本,设定优先级;

设计方案;

 日常中我们总在说AB testing,做的是两个版本的对比,其实也可以是ABCD testing,四个版本的对比,只不过实际中我们做得更多的就是AB testing。再有一个,就是预估成本,这个是很有必要的,如果你切了50%的流量(或者更大的流量),将你的新版本上线跑了一周,假如情况非常糟糕,对于大公司来说,可能损失几个亿,或者是几十个亿,因此再进行实验之前,一定要好好预算一下,你究竟可以承担多大的风险,最后在设定你的方案。


image.pngimage.pngimage.pngimage.pngimage.png

相关文章
|
10天前
|
存储 分布式计算 大数据
基于阿里云大数据平台的实时数据湖构建与数据分析实战
在大数据时代,数据湖作为集中存储和处理海量数据的架构,成为企业数据管理的核心。阿里云提供包括MaxCompute、DataWorks、E-MapReduce等在内的完整大数据平台,支持从数据采集、存储、处理到分析的全流程。本文通过电商平台案例,展示如何基于阿里云构建实时数据湖,实现数据价值挖掘。平台优势包括全托管服务、高扩展性、丰富的生态集成和强大的数据分析工具。
|
13天前
|
数据采集 供应链 API
实战指南:通过1688开放平台API获取商品详情数据(附Python代码及避坑指南)
1688作为国内最大的B2B供应链平台,其API为企业提供合法合规的JSON数据源,直接获取批发价、SKU库存等核心数据。相比爬虫方案,官方API避免了反爬严格、数据缺失和法律风险等问题。企业接入1688商品API需完成资质认证、创建应用、签名机制解析及调用接口四步。应用场景包括智能采购系统、供应商评估模型和跨境选品分析。提供高频问题解决方案及安全合规实践,确保数据安全与合法使用。立即访问1688开放平台,解锁B2B数据宝藏!
|
14天前
|
API 开发工具 Python
【Azure Developer】编写Python SDK代码实现从China Azure中VM Disk中创建磁盘快照Snapshot
本文介绍如何使用Python SDK为中国区微软云(China Azure)中的虚拟机磁盘创建快照。通过Azure Python SDK的Snapshot Class,指定`location`和`creation_data`参数,使用`Copy`选项从现有磁盘创建快照。代码示例展示了如何配置Default Azure Credential,并设置特定于中国区Azure的`base_url`和`credential_scopes`。参考资料包括官方文档和相关API说明。
|
15天前
|
SQL JSON 数据可视化
基于 DIFY 的自动化数据分析实战
本文介绍如何使用DIFY搭建数据分析自动化流程,实现从输入需求到查询数据库、LLM分析再到可视化输出的全流程。基于经典的employees数据集和DIFY云端环境,通过LLM-SQL解析、SQL执行、LLM数据分析及ECharts可视化等模块,高效完成数据分析任务。此方案适用于人力资源分析、薪酬管理等数据密集型业务,显著提升效率并降低成本。
1257 8
|
19天前
|
机器学习/深度学习 存储 数据可视化
这份Excel+Python飞速搞定数据分析手册,简直可以让Excel飞起来
本书介绍了如何将Python与Excel结合使用,以提升数据分析和处理效率。内容涵盖Python入门、pandas库的使用、通过Python包操作Excel文件以及使用xlwings对Excel进行编程。书中详细讲解了Anaconda、Visual Studio Code和Jupyter笔记本等开发工具,并探讨了NumPy、DataFrame和Series等数据结构的应用。此外,还介绍了多个Python包(如OpenPyXL、XlsxWriter等)用于在无需安装Excel的情况下读写Excel文件,帮助用户实现自动化任务和数据处理。
|
2月前
|
存储 缓存 Java
Python高性能编程:五种核心优化技术的原理与Python代码
Python在高性能应用场景中常因执行速度不及C、C++等编译型语言而受质疑,但通过合理利用标准库的优化特性,如`__slots__`机制、列表推导式、`@lru_cache`装饰器和生成器等,可以显著提升代码效率。本文详细介绍了这些实用的性能优化技术,帮助开发者在不牺牲代码质量的前提下提高程序性能。实验数据表明,这些优化方法能在内存使用和计算效率方面带来显著改进,适用于大规模数据处理、递归计算等场景。
81 5
Python高性能编程:五种核心优化技术的原理与Python代码
|
3月前
|
Python
课程设计项目之基于Python实现围棋游戏代码
游戏进去默认为九路玩法,当然也可以选择十三路或是十九路玩法 使用pycharam打开项目,pip安装模块并引用,然后运行即可, 代码每行都有详细的注释,可以做课程设计或者毕业设计项目参考
87 33
|
3月前
|
JavaScript API C#
【Azure Developer】Python代码调用Graph API将外部用户添加到组,结果无效,也无错误信息
根据Graph API文档,在单个请求中将多个成员添加到组时,Python代码示例中的`members@odata.bind`被错误写为`members@odata_bind`,导致用户未成功添加。
61 10
|
Python
PYTHON实战两数之和
1. 两数之和 难度:简单 收藏 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数,并返回它们的数组下标。 你可以假设每种输入只会对应一个答案。但是,数组中同一个元素在答案里不能重复出现。 你可以按任意顺序返回答案。
214 0
PYTHON实战两数之和
|
4天前
|
机器学习/深度学习 设计模式 API
Python 高级编程与实战:构建 RESTful API
本文深入探讨了使用 Python 构建 RESTful API 的方法,涵盖 Flask、Django REST Framework 和 FastAPI 三个主流框架。通过实战项目示例,详细讲解了如何处理 GET、POST 请求,并返回相应数据。学习这些技术将帮助你掌握构建高效、可靠的 Web API。

热门文章

最新文章

推荐镜像

更多