基于阿里云大数据产品的重庆地区招聘数据分析

简介: 随着重庆的迅速发展,越来越多的毕业生以及外来人员选择在重庆工作,同时重庆也提供了众多的工作岗位。在数以万计的工作岗位中,求职者对公司与职位了解甚少,这对他们的工作选择带来了巨大的问题。我们将基于重庆地区的各个公司招聘信息数据进行分析,让大家能够迅速清晰了解各个职位的薪资等信息

一、项目背景
随着重庆的迅速发展,越来越多的毕业生以及外来人员选择在重庆工作,同时重庆也提供了众多的工作岗位。在数以万计的工作岗位中,求职者对公司与职位了解甚少,这对他们的工作选择带来了巨大的问题。为了帮助求职者对重庆的公司和需求的工作岗位,我们将基于重庆地区的各个公司招聘信息数据进行分析,让大家能够迅速清晰了解各个职位的薪资,要求等以及公司的潜力等等信息,相互比较,做出合理选择。同时政府也可以通过招聘信息判断当前重庆的人才需求。

二、项目处理流程
image.png

三、项目难点
1.同一或者不同职业类中出现了的相同的招聘职业名时的统计问题。
关系表中有一个唯一的主键URL,它是该职位信息网页的一部分url地址,不会有重复,可以对职位进行区分。
2.优势公司的推荐标准的设置。
评判优势公司的依据:公司所在的城市,公司的融资情况,公司所提供的职位数量。
公司离重庆越近,融资情况越好,提供的职位越多,那么该公司的优势就越大
3.在进行数据分析的时候遇到了大量的困难,数据所涉及到了各行各业种类太多,数据处理太复杂,对于不了解的职位类型可能得到不正确的结果
将不了解的职位类别不再向下细分,以大类为单位进行数据分析,降低了数据的精确性,但提高了结果的正确性。
4.数据的分类不太科学,有些分类里面的数据量过少,不具有代表性。
去除该数据
5.爬数据时,网站有反爬系统封掉IP,这对获取数据来说,是致命的。
经过一段时间的试验,了解到了反爬系统的工作流程,制定相应的方案饶过反爬系统,高效地获取数据。

四、项目结果及可视化呈现
1.重庆地区当前的热门行业有互联网,生活服务,娱乐文化,电子商务,旅游,在线教育等等,拥有9314家招聘公司,提供9万个职位
2.当前需求量最大的职业方向是技术类与管理类,其中金融类职业的平均工资最高,采购贸易工资低,招收少。同时发展趋势较好的是与IT相关的技术类职业
3.对于各个职业来说学历超过本科以上工资会有明显增加,工作经验3年以上对工资影响最大。重庆人才需求的趋势在向高学历发展,硕士占比越来越大
4.目前重庆地区行业多样化,职业需求量大,互联网等行业值得投资,工作最有利的职业是技术方面,有一定工作经验的最适合在这里工作

image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
8月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
8月前
|
机器学习/深度学习 搜索推荐 数据挖掘
数据分析真能让音乐产业更好听吗?——聊聊大数据在音乐里的那些事
数据分析真能让音乐产业更好听吗?——聊聊大数据在音乐里的那些事
357 9
|
9月前
|
人工智能 数据挖掘 数据库
通义灵码产品演示: 数据库设计与数据分析
本演示展示如何使用通义灵码进行数据库设计与数据分析。通过SQLite构建电商订单表,利用AI生成表结构、插入样本数据,并完成多维度数据分析及可视化图表展示,体现AI在数据库操作中的高效能力。
801 8
|
9月前
|
数据可视化 数据挖掘 大数据
基于python大数据的水文数据分析可视化系统
本研究针对水文数据分析中的整合难、分析单一和可视化不足等问题,提出构建基于Python的水文数据分析可视化系统。通过整合多源数据,结合大数据、云计算与人工智能技术,实现水文数据的高效处理、深度挖掘与直观展示,为水资源管理、防洪减灾和生态保护提供科学决策支持,具有重要的应用价值和社会意义。
|
10月前
|
存储 数据挖掘 大数据
基于python大数据的用户行为数据分析系统
本系统基于Python大数据技术,深入研究用户行为数据分析,结合Pandas、NumPy等工具提升数据处理效率,利用B/S架构与MySQL数据库实现高效存储与访问。研究涵盖技术背景、学术与商业意义、国内外研究现状及PyCharm、Python语言等关键技术,助力企业精准营销与产品优化,具有广泛的应用前景与社会价值。
|
存储 关系型数据库 MySQL
大数据新视界 --面向数据分析师的大数据大厂之 MySQL 基础秘籍:轻松创建数据库与表,踏入大数据殿堂
本文详细介绍了在 MySQL 中创建数据库和表的方法。包括安装 MySQL、用命令行和图形化工具创建数据库、选择数据库、创建表(含数据类型介绍与选择建议、案例分析、最佳实践与注意事项)以及查看数据库和表的内容。文章专业、严谨且具可操作性,对数据管理有实际帮助。
大数据新视界 --面向数据分析师的大数据大厂之 MySQL 基础秘籍:轻松创建数据库与表,踏入大数据殿堂
|
SQL 数据可视化 大数据
从数据小白到大数据达人:一步步成为数据分析专家
从数据小白到大数据达人:一步步成为数据分析专家
754 92
|
11月前
|
机器学习/深度学习 Java 大数据
Java 大视界 -- Java 大数据在智能政务公共资源交易数据分析与监管中的应用(202)
本篇文章深入探讨了 Java 大数据在智能政务公共资源交易监管中的创新应用。通过构建高效的数据采集、智能分析与可视化决策系统,Java 大数据技术成功破解了传统监管中的数据孤岛、效率低下和监管滞后等难题,为公共资源交易打造了“智慧卫士”,助力政务监管迈向智能化、精准化新时代。
|
存储 分布式计算 大数据
基于阿里云大数据平台的实时数据湖构建与数据分析实战
在大数据时代,数据湖作为集中存储和处理海量数据的架构,成为企业数据管理的核心。阿里云提供包括MaxCompute、DataWorks、E-MapReduce等在内的完整大数据平台,支持从数据采集、存储、处理到分析的全流程。本文通过电商平台案例,展示如何基于阿里云构建实时数据湖,实现数据价值挖掘。平台优势包括全托管服务、高扩展性、丰富的生态集成和强大的数据分析工具。
|
9月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
624 14