基于阿里云平台的大数据教学案例 —— 各平台游戏的销量及评分分析

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 现在的时代,互联网发展越发的发达,随之带来兴起的电子游戏产业也越来越引起人们的重视。所以我们组在网上收集到了近年来关于各大平台所发行的一些游戏的相关发行量以及评分数据,根据这些数据利用阿里云的相关产品技术来进行分析过去和现在的哪些厂商的哪些游戏比较热门,做出可视化的图表,并为游戏厂商的未来所做游戏做一些参考。

一、实验题目
近年各平台游戏的销量及评分分析

二、实验目的
现在的时代,互联网发展越发的发达,随之带来兴起的电子游戏产业也越来越引起人们的重视。所以我们组在网上收集到了近年来关于各大平台所发行的一些游戏的相关发行量以及评分数据,根据这些数据利用阿里云的相关产品技术来进行分析过去和现在的哪些厂商的哪些游戏比较热门,做出可视化的图表,并为游戏厂商的未来所做游戏做一些参考。

三、实验难点
混淆矩阵的使用与Sql语句的编写

四、实验过程
数据集的描述:
image.png

一共16720条数据

Maxcompute
创建数据表:

CREATE TABLE IF NOT EXISTS video_game_sales1
(
name STRING,
platform STRING,
year_of_release STRING,
genre STRING,
publisher STRING,
na_sales DOUBLE,
eu_sales DOUBLE,
jp_sales DOUBLE,
other_sales DOUBLE,
global_sales DOUBLE,
critic_score STRING,
critic_count STRING,
user_score STRING,
user_count STRING,
developer STRING,
rating STRING
) ;

image.png

共140000+条数据,来源于互联网下载
字段的含义:
Name:游戏名
Platfrom:游戏平台
Year_of_relese 每年发售的游戏数
Genre 游戏类型
Publisher 发行商
Na_sales 北美销量
jp_sales 日本销量
other_sales 其他销量
global_sales 全球销量
Critic_score 评论家分数
Critic_count 评论家数量
User_score 用户评分
User_count 用户数量
Developer 制作商
Rating 评级

机器学习PAI
找到dotaworks里的数据源,然后创建不同平台的游戏总数表:

SELECT platform,
count(platform) as 游戏总数 from video_game_sales1 group by platform

利用混淆矩阵随机森林制作预测表:
image.png

利用混淆矩阵和随机森林制作年份游戏数量预测准确率

四个不同地区的游戏销量:

select Genre,sum(NA_Sales) as 销售数量 from video_game_sales1 group by Genre
select Genre,sum(EU_Sales) as 销售数量 from video_game_sales1 group by Genre
select Genre,sum(JP_Sales) as 销售数量 from video_game_sales1 group by Genre

image.png

四个不同地区的游戏销量:

select Genre,sum(NA_Sales) as 销售数量 from video_game_sales1 group by Genre
select Genre,sum(EU_Sales) as 销售数量 from video_game_sales1 group by Genre
select Genre,sum(JP_Sales) as 销售数量 from video_game_sales1 group by Genre
select Genre,sum(GLOBAL_Sales) as 销售数量 from video_game_sales1 group by Genre

image.png

不同年份的游戏销售额:

select Year_of_Release,sum(Global_Sales) as 总销售额 from video_game_sales1 group by Year_of_Release

数据表展示:
image.png
image.png
image.png
image.png
image.png
image.png

QuickBi:
把数据源添加到数据集后在面板上填入对应的维度和度量
image.png
image.png
image.png
image.png

总结:
根据本项目分析得来的数据,以及可视化结果显示:随着时间的增长,各大厂商所发行的游戏数量也都有都有所增长,玩家购买的数量也是增长的。在近年来动作游戏最受玩家们的欢迎,运动和射击游戏紧随其后,策略游戏和解谜游戏玩家受众群较少。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
13天前
|
存储 人工智能 数据管理
|
6天前
|
存储 人工智能 数据管理
媒体声音|专访阿里云数据库周文超博士:AI就绪的智能数据平台设计思路
在生成式AI的浪潮中,数据的重要性日益凸显。大模型在实际业务场景的落地过程中,必须有海量数据的支撑:经过训练、推理和分析等一系列复杂的数据处理过程,才能最终产生业务价值。事实上,大模型本身就是数据处理后的产物,以数据驱动的决策与创新需要通过更智能的平台解决数据多模处理、实时分析等问题,这正是以阿里云为代表的企业推动 “Data+AI”融合战略的核心动因。
|
12天前
|
机器学习/深度学习 分布式计算 数据挖掘
MaxFrame 性能评测:阿里云MaxCompute上的分布式Pandas引擎
MaxFrame是一款兼容Pandas API的分布式数据分析工具,基于MaxCompute平台,极大提升了大规模数据处理效率。其核心优势在于结合了Pandas的易用性和MaxCompute的分布式计算能力,无需学习新编程模型即可处理海量数据。性能测试显示,在涉及`groupby`和`merge`等复杂操作时,MaxFrame相比本地Pandas有显著性能提升,最高可达9倍。适用于大规模数据分析、数据清洗、预处理及机器学习特征工程等场景。尽管存在网络延迟和资源消耗等问题,MaxFrame仍是处理TB级甚至PB级数据的理想选择。
39 4
|
15天前
|
SQL 存储 分布式计算
阿里云 Paimon + MaxCompute 极速体验
Paimon 和 MaxCompute 的对接经历了长期优化,解决了以往性能不足的问题。通过半年紧密合作,双方团队专门提升了 Paimon 在 MaxCompute 上的读写性能。主要改进包括:采用 Arrow 接口减少数据转换开销,内置 Paimon SDK 提升启动速度,实现原生读写能力,减少中间拷贝与转换,显著降低 CPU 开销与延迟。经过双十一实战验证,Paimon 表的读写速度已接近 MaxCompute 内表,远超传统外表。欢迎体验!
|
8月前
|
监控 安全 数据可视化
java基于微服务的智慧工地管理云平台SaaS源码 数据大屏端 APP移动端
围绕施工现场人、机、料、法、环、各个环节,“智慧工地”将传统建筑施工与大数据物联网无缝结合集成多个智慧应用子系统,施工数据云端整合分析,提供专业、先进、安全的智慧工地解决方案。
173 1
|
8月前
|
机器学习/深度学习 算法 数据可视化
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
260 0
|
大数据 定位技术
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (3)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (3)
289 0
|
SQL 安全 大数据
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (1)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (1)
704 0
|
弹性计算 分布式计算 安全
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (2)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (2)
326 0
|
机器学习/深度学习 消息中间件 监控
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (4)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (4)
297 0
下一篇
开通oss服务