基于阿里云平台的大数据教学案例 —— 各平台游戏的销量及评分分析

简介: 现在的时代,互联网发展越发的发达,随之带来兴起的电子游戏产业也越来越引起人们的重视。所以我们组在网上收集到了近年来关于各大平台所发行的一些游戏的相关发行量以及评分数据,根据这些数据利用阿里云的相关产品技术来进行分析过去和现在的哪些厂商的哪些游戏比较热门,做出可视化的图表,并为游戏厂商的未来所做游戏做一些参考。

一、实验题目
近年各平台游戏的销量及评分分析

二、实验目的
现在的时代,互联网发展越发的发达,随之带来兴起的电子游戏产业也越来越引起人们的重视。所以我们组在网上收集到了近年来关于各大平台所发行的一些游戏的相关发行量以及评分数据,根据这些数据利用阿里云的相关产品技术来进行分析过去和现在的哪些厂商的哪些游戏比较热门,做出可视化的图表,并为游戏厂商的未来所做游戏做一些参考。

三、实验难点
混淆矩阵的使用与Sql语句的编写

四、实验过程
数据集的描述:
image.png

一共16720条数据

Maxcompute
创建数据表:

CREATE TABLE IF NOT EXISTS video_game_sales1
(
name STRING,
platform STRING,
year_of_release STRING,
genre STRING,
publisher STRING,
na_sales DOUBLE,
eu_sales DOUBLE,
jp_sales DOUBLE,
other_sales DOUBLE,
global_sales DOUBLE,
critic_score STRING,
critic_count STRING,
user_score STRING,
user_count STRING,
developer STRING,
rating STRING
) ;

image.png

共140000+条数据,来源于互联网下载
字段的含义:
Name:游戏名
Platfrom:游戏平台
Year_of_relese 每年发售的游戏数
Genre 游戏类型
Publisher 发行商
Na_sales 北美销量
jp_sales 日本销量
other_sales 其他销量
global_sales 全球销量
Critic_score 评论家分数
Critic_count 评论家数量
User_score 用户评分
User_count 用户数量
Developer 制作商
Rating 评级

机器学习PAI
找到dotaworks里的数据源,然后创建不同平台的游戏总数表:

SELECT platform,
count(platform) as 游戏总数 from video_game_sales1 group by platform

利用混淆矩阵随机森林制作预测表:
image.png

利用混淆矩阵和随机森林制作年份游戏数量预测准确率

四个不同地区的游戏销量:

select Genre,sum(NA_Sales) as 销售数量 from video_game_sales1 group by Genre
select Genre,sum(EU_Sales) as 销售数量 from video_game_sales1 group by Genre
select Genre,sum(JP_Sales) as 销售数量 from video_game_sales1 group by Genre

image.png

四个不同地区的游戏销量:

select Genre,sum(NA_Sales) as 销售数量 from video_game_sales1 group by Genre
select Genre,sum(EU_Sales) as 销售数量 from video_game_sales1 group by Genre
select Genre,sum(JP_Sales) as 销售数量 from video_game_sales1 group by Genre
select Genre,sum(GLOBAL_Sales) as 销售数量 from video_game_sales1 group by Genre

image.png

不同年份的游戏销售额:

select Year_of_Release,sum(Global_Sales) as 总销售额 from video_game_sales1 group by Year_of_Release

数据表展示:
image.png
image.png
image.png
image.png
image.png
image.png

QuickBi:
把数据源添加到数据集后在面板上填入对应的维度和度量
image.png
image.png
image.png
image.png

总结:
根据本项目分析得来的数据,以及可视化结果显示:随着时间的增长,各大厂商所发行的游戏数量也都有都有所增长,玩家购买的数量也是增长的。在近年来动作游戏最受玩家们的欢迎,运动和射击游戏紧随其后,策略游戏和解谜游戏玩家受众群较少。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
8月前
|
数据可视化 关系型数据库 MySQL
基于python大数据的的海洋气象数据可视化平台
针对海洋气象数据量大、维度多的挑战,设计基于ECharts的可视化平台,结合Python、Django与MySQL,实现数据高效展示与交互分析,提升科研与决策效率。
|
11月前
|
存储 分布式计算 大数据
【赵渝强老师】阿里云大数据存储计算服务:MaxCompute
阿里云MaxCompute是快速、全托管的TB/PB级数据仓库解决方案,提供海量数据存储与计算服务。支持多种计算模型,适用于大规模离线数据分析,具备高安全性、低成本、易用性强等特点,助力企业高效处理大数据。
514 0
|
8月前
|
传感器 人工智能 监控
拔俗多模态跨尺度大数据AI分析平台:让复杂数据“开口说话”的智能引擎
在数字化时代,多模态跨尺度大数据AI分析平台应运而生,打破数据孤岛,融合图像、文本、视频等多源信息,贯通微观与宏观尺度,实现智能诊断、预测与决策,广泛应用于医疗、制造、金融等领域,推动AI从“看懂”到“会思考”的跃迁。
651 0
|
9月前
|
人工智能 分布式计算 DataWorks
阿里云大数据AI产品月刊-2025年8月
阿里云大数据& AI 产品技术月刊【2025年 8 月】,涵盖 8 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
665 2
|
9月前
|
存储 分布式计算 资源调度
【赵渝强老师】阿里云大数据MaxCompute的体系架构
阿里云MaxCompute是快速、全托管的EB级数据仓库解决方案,适用于离线计算场景。它由计算与存储层、逻辑层、接入层和客户端四部分组成,支持多种计算任务的统一调度与管理。
777 1
|
9月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
608 14
|
11月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
381 4
|
10月前
|
机器学习/深度学习 运维 监控
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
921 0
|
9月前
|
传感器 人工智能 监控
数据下田,庄稼不“瞎种”——聊聊大数据如何帮农业提效
数据下田,庄稼不“瞎种”——聊聊大数据如何帮农业提效
278 14