小白学数据分析------>相关分析之距离分析在道具购买量的应用探索

简介: 前几天,写过一篇关于相关分析的的文章,很多人都看到了并有很多人在咨询关于这篇文章的一些内容,相关分析是一类很有用的分析方法,如之前所提到的,相关分析由三部分组成,前几日的文章是讲了其中第一部分,第二部分是偏相关分析,第三部分就是复相关分析,说白了其实就是相关分析变量的多少来确定这三部分的。

 

前几天,写过一篇关于相关分析的的文章,很多人都看到了并有很多人在咨询关于这篇文章的一些内容,相关分析是一类很有用的分析方法,如之前所提到的,相关分析由三部分组成,前几日的文章是讲了其中第一部分,第二部分是偏相关分析,第三部分就是复相关分析,说白了其实就是相关分析变量的多少来确定这三部分的。今天这里不谈偏相关分析,以为网友给我截图,问我下面的成交量相关系数的是怎么算出来的,其实这个就是复相关的典型应用,多变量的相关分析。插一句,该图来自于腾讯大讲堂15-市场研究及数据分析理念及方法概要介绍。大家如果需要,请到百度文库或者联系我都OK。

今天将通过Excel和SPSS向大家说说怎么来进行多变量的相关分析,既然是游戏数据分析,那么自然少不了如何利用游戏数据实现多变量的相关分析。在游戏数据分析方面,很多的数据都可以进行相关分析,比如界面按钮的点击次数,今天我们选取游戏道具的购买量进行相关分析。

我们知道游戏道具非常多,换句话说如果进行相关分析,尽管相关分析可以满足我们的计算要求,但是对于我们后期的评估和决策带来非常大不便利,所以这里建议大家做道具的相关分析先进行道具分类,比如FPS游戏中把AK47,M4A1归类为突击步枪,或者再高一个类别,武器,这样在不同的分类维度下进行相关分析,便于我们从不同的高度和角度来进行分析和决策。以下所示为示例数据(模拟),可以看到有7个品类的道具,从101-107,取出来共计10周的数据。

下面我们来看如何通过Excel进行多变量的相关分析。如何打开数据分析,选择相关分析,在上次文章已经提到了,这里不再累述,这里打开一下的对话框。

选择数据,数据区域选择B1:H1,选择好输出区域,点击确定,得到如下的相似矩阵:

有关这个矩阵的分析稍后在说完SPSS的操作再讲解,下面看看SPSS如何进行相关分析。在SPSS中,有专门的模块进行多变量的相关分析。SPSS中针对相关分析的三部分设置了三部分模块进行独立的分析。多变量的相关分析在SPSS中叫做距离分析,相对偏相关分析通过控制一些被认为次要的变量的影响得到两个变量之间的相关系数,距离分析解决的问题更加复杂,因为实际应用时每一个变量都携带了一定的信息,但是彼此在某些方面又是重叠的,举个例子,比如有个变量叫做突击步枪,突击步枪的销售量代表了AK47,M4A1等突击步枪的销售情况和信息,同时突击步枪也属于武器类别,与机枪等类别又有交叉,因为机枪和突击步枪都属于武器类别。

距离分析是对变量之间相似或者不相似程度的测度,通过计算一对变量之间的广义距离,将距离较小的变量归为一类,距离较大的变量归为其他类,这也是为聚类分析、因子分析打下基础。有关距离分析的更多详细内容这里不再累述,大家可以自己百度。

具体操作如下,首先看到SPSS中展示的数据,此为101-107系列道具的销售量:

之后选择分析|相关|距离界面,选择界面如下所示:

弹出对话框,如下所示,将var101-var107选入变量框中,此处最少包含两个变量。

计算距离包括两个两选择项,个案间和变量间,表示输出结果是个案或者变量间距离分析值。度量标准包括不相似性和相似性两个选项以及一个度量按钮。不相似性表示测度方法为不相似性测度。此时如果点击度量,弹出来距离:非相似性度量对话框,如下图所示:

有关该方面知识在这里不作解释和阐述,主要来看距离:相似性对话框的设置,首先如下图所示:

度量标准选择区间|Pearson相关性,转换值标准化|Z得分,其他的选项默认就可以了,这里简单解释一下几个选择的含义。Pearson相关性表示两个值矢量之间的积矩相关性,是定矩数据的缺省相似性测量。转换值是在计算距离之前对变量进行标准化的方法,这里使用Z得分,Z得分表示将值标准化到均值为0且标准差为1的Z得分,但同时注意标准化要指定标准化对象,这里是变量。

在完成以上的设置后,点击确定将会输出结果,上面的为案例处理摘要,下面的为距离分析的近似矩阵。

下面我们结合Excel和SPSS的分析结果来具体分析一下,在Excel的分析结果中,我们发现105系列道具相关性最弱,那么这个品类就需要我们去进一步探究一下。从SPSS的结果来看,105系列道具确实相关性系数较低,其次是103系列道具相关系数也比较低,但是从总体的Excel和SPSS分析结果来看,101与106、102与106、103与105、104与106、107与102相关性很高,这就是我们得出的结论,最后我们来看看这几个类别道具具体指的是什么:

101:突击步枪

102:冲锋枪

103:机枪

104:狙击步枪

105:shouqiang

106:投掷武器

107:近战武器

故而从这里我们再来看一下,大概了解了FPS游戏的玩家作战配置,突击步枪+投掷武器;冲锋枪+投掷武器;机枪+投掷武器;狙击步枪+投掷武器;冲锋枪+近战武器。当然这种配置不是绝对的,还要考虑游戏本身在这方面的设计情况,比如很多游戏主武器是突击步枪,副武器是冲锋枪,这种情况是要结合业务来考虑,而最终我们通过分析得出的结果,也要根据具体的需要进行筛选和调整。

以上是相关性分析的最复杂的一部分,希望解决一部分网友的疑问,这种方法的参考性和实际利用性还需要进一步检验和证明,属于探索内容,请使用者慎重考虑。

参考:

SPSS统计分析从入门到精通 陈胜可著

SPSS18官方文档

相关文章
|
3天前
|
数据采集 机器学习/深度学习 数据可视化
数据挖掘实战:Python在金融数据分析中的应用案例
Python在金融数据分析中扮演关键角色,用于预测市场趋势和风险管理。本文通过案例展示了使用Python库(如pandas、numpy、matplotlib等)进行数据获取、清洗、分析和建立预测模型,例如计算苹果公司(AAPL)股票的简单移动平均线,以展示基本流程。此示例为更复杂的金融建模奠定了基础。【6月更文挑战第13天】
|
7天前
|
JSON 数据挖掘 API
数据分析实战丨基于pygal与requests分析GitHub最受欢迎的Python库
数据分析实战丨基于pygal与requests分析GitHub最受欢迎的Python库
18 2
|
8天前
|
机器学习/深度学习 数据可视化 数据挖掘
python每日可视化分析:从过去到现代数据分析的演进
python每日可视化分析:从过去到现代数据分析的演进
|
11天前
|
算法 数据挖掘 数据处理
数据分析之可重复与独立样本的T-Test分析
数据分析之可重复与独立样本的T-Test分析
16 2
|
25天前
|
机器学习/深度学习 数据可视化 数据挖掘
Python在数据分析中的强大应用
Python在数据分析中扮演关键角色,凭借其强大的功能和简洁的语法赢得了数据分析师的青睐。pandas库简化了数据处理和清洗,如读取多种格式文件、处理缺失值和重复值。数据可视化方面,matplotlib和seaborn能生成各类图表,帮助直观展示数据。此外,Python的scikit-learn用于机器学习和预测分析,支持线性回归等多种模型。面对复杂任务,Python结合Dask进行并行处理,或利用NLP库处理非结构化数据。通过集成和自动化,Python提高了数据分析效率,成为该领域的首选工具。
|
1月前
|
数据采集 人工智能 数据挖掘
「一行分析」利用12000条招聘数据分析Python学习方向和就业方向
「一行分析」利用12000条招聘数据分析Python学习方向和就业方向
|
1月前
|
存储 监控 NoSQL
【MongoDB 专栏】MongoDB 在实时数据分析中的应用
【5月更文挑战第11天】MongoDB,作为强大的非关系型数据库,擅长实时数据分析。其灵活数据模型适应多样化数据,分布式架构支持水平扩展,处理海量数据和高并发查询。应用于物联网、实时监控、金融交易分析及电商个性化推荐等领域。结合流处理技术和数据可视化工具,提升实时分析效能。然而,注意数据一致性和性能调优是应用关键。未来,MongoDB将持续发展,为企业实时数据分析带来更多可能性和机遇。
【MongoDB 专栏】MongoDB 在实时数据分析中的应用
|
1月前
|
数据采集 数据可视化 数据挖掘
Python在数据分析中的强大应用
【5月更文挑战第5天】Python在数据驱动时代成为数据分析师首选工具,得益于其丰富的数据科学库(如NumPy、Pandas、Matplotlib、Seaborn和SciPy)。这些库支持数据清洗、探索、建模和可视化。Python在数据清洗、文本分析、Web数据抓取和大数据处理等方面有广泛应用,并因其易学性、强大社区和广泛适用性而备受青睐。未来,Python在数据分析领域的角色将更加重要。
|
1天前
|
存储 数据挖掘 索引
Python streamlit框架开发数据分析网站并免费部署
使用Python的Streamlit框架,开发了一个在线数据分析工具,替代Excel查看设备温度CSV数据。通过pandas读取数据,matplotlib绘制图表。程序处理CSV,提取所需列,计算最大最小平均值,用户可多选查看特定数据。[GitHub](https://github.com/yigedaigua/MGHB)上有完整代码,应用已部署至Streamlit Cloud。
|
1天前
|
数据挖掘 数据库连接 Python
GitHub高赞!Python零基础也能搞定的数据分析与处理
经常会有人让我推荐一些 Python 入门教程。虽然 Python 入内教程到处都有,但是这些教程要么太宽泛(没有讲任何关于数据分析的内容),要么太专业(全是关于科学原理的内容)。然而Excel用户往往处在一个中间位置:他们的确是和数据打交道,但是科学原理对于他们来说可能又太专业了。他们常常有一些现有教程无法满足的特殊需求,举例如下 • 为完成某个任务,我应该用哪个 Python-Excel包? • 我如何将 Power Query 数据库连接迁移到 Python? • Excel中的 AutoFilter和数据透视表在 Python 中对应的是什么?

热门文章

最新文章