基于阿里云大数据产品的重庆地区招聘数据分析

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 随着重庆的迅速发展,越来越多的毕业生以及外来人员选择在重庆工作,同时重庆也提供了众多的工作岗位。在数以万计的工作岗位中,求职者对公司与职位了解甚少,这对他们的工作选择带来了巨大的问题。我们将基于重庆地区的各个公司招聘信息数据进行分析,让大家能够迅速清晰了解各个职位的薪资等信息

一、项目背景
随着重庆的迅速发展,越来越多的毕业生以及外来人员选择在重庆工作,同时重庆也提供了众多的工作岗位。在数以万计的工作岗位中,求职者对公司与职位了解甚少,这对他们的工作选择带来了巨大的问题。为了帮助求职者对重庆的公司和需求的工作岗位,我们将基于重庆地区的各个公司招聘信息数据进行分析,让大家能够迅速清晰了解各个职位的薪资,要求等以及公司的潜力等等信息,相互比较,做出合理选择。同时政府也可以通过招聘信息判断当前重庆的人才需求。

二、项目处理流程
image.png

三、项目难点
1.同一或者不同职业类中出现了的相同的招聘职业名时的统计问题。
关系表中有一个唯一的主键URL,它是该职位信息网页的一部分url地址,不会有重复,可以对职位进行区分。
2.优势公司的推荐标准的设置。
评判优势公司的依据:公司所在的城市,公司的融资情况,公司所提供的职位数量。
公司离重庆越近,融资情况越好,提供的职位越多,那么该公司的优势就越大
3.在进行数据分析的时候遇到了大量的困难,数据所涉及到了各行各业种类太多,数据处理太复杂,对于不了解的职位类型可能得到不正确的结果
将不了解的职位类别不再向下细分,以大类为单位进行数据分析,降低了数据的精确性,但提高了结果的正确性。
4.数据的分类不太科学,有些分类里面的数据量过少,不具有代表性。
去除该数据
5.爬数据时,网站有反爬系统封掉IP,这对获取数据来说,是致命的。
经过一段时间的试验,了解到了反爬系统的工作流程,制定相应的方案饶过反爬系统,高效地获取数据。

四、项目结果及可视化呈现
1.重庆地区当前的热门行业有互联网,生活服务,娱乐文化,电子商务,旅游,在线教育等等,拥有9314家招聘公司,提供9万个职位
2.当前需求量最大的职业方向是技术类与管理类,其中金融类职业的平均工资最高,采购贸易工资低,招收少。同时发展趋势较好的是与IT相关的技术类职业
3.对于各个职业来说学历超过本科以上工资会有明显增加,工作经验3年以上对工资影响最大。重庆人才需求的趋势在向高学历发展,硕士占比越来越大
4.目前重庆地区行业多样化,职业需求量大,互联网等行业值得投资,工作最有利的职业是技术方面,有一定工作经验的最适合在这里工作

image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
25天前
|
人工智能 分布式计算 大数据
大数据&AI产品月刊【2024年9月】
大数据& AI 产品技术月刊【2024年9月】,涵盖本月技术速递、2024云栖大会实录、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
9天前
|
Oracle 大数据 数据挖掘
企业内训|大数据产品运营实战培训-某电信运营商大数据产品研发中心
本课程是TsingtaoAI专为某电信运营商的大数据产品研发中心的产品支撑组设计,旨在深入探讨大数据在电信运营商领域的应用与运营策略。通过密集的培训,从数据的本质与价值出发,系统解析大数据工具和技术的最新进展,深入剖析行业内外的实践案例。课程涵盖如何理解和评估数据、如何有效运用大数据技术、以及如何在不同业务场景中实现数据的价值转化。
21 0
|
2月前
|
机器学习/深度学习 数据挖掘 大数据
大数据时代的“淘金术”:Python数据分析+深度学习框架实战指南
在大数据时代,数据被视为新财富源泉,而从海量信息中提取价值成为企业竞争的核心。本文通过对比方式探讨如何运用Python数据分析与深度学习框架实现这一目标。Python凭借其强大的数据处理能力及丰富库支持,已成为数据科学家首选工具;而TensorFlow和PyTorch等深度学习框架则为复杂模型构建提供强有力的技术支撑。通过融合Python数据分析与深度学习技术,我们能在各领域中发掘数据的无限潜力。无论是商业分析还是医疗健康,掌握这些技能都将为企业和社会带来巨大价值。
53 6
|
21天前
|
SQL 运维 大数据
大数据实时计算产品的对比测评
在使用多种Flink实时计算产品后,我发现Flink凭借其流批一体的优势,在实时数据处理领域表现出色。它不仅支持复杂的窗口机制与事件时间处理,还具备高效的数据吞吐能力和精准的状态管理,确保数据处理既快又准。此外,Flink提供了多样化的编程接口和运维工具,简化了开发流程,但在界面友好度上还有提升空间。针对企业级应用,Flink展现了高可用性和安全性,不过价格因素可能影响小型企业的采纳决策。未来可进一步优化文档和自动化调优工具,以提升用户体验。
90 0
|
21天前
|
SQL 存储 监控
大数据-161 Apache Kylin 构建Cube 按照日期、区域、产品、渠道 与 Cube 优化
大数据-161 Apache Kylin 构建Cube 按照日期、区域、产品、渠道 与 Cube 优化
30 0
|
2月前
|
人工智能 分布式计算 DataWorks
大数据&AI产品月刊【2024年8月】
大数据& AI 产品技术月刊【2024年8月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
3月前
|
Java Spring 安全
Spring 框架邂逅 OAuth2:解锁现代应用安全认证的秘密武器,你准备好迎接变革了吗?
【8月更文挑战第31天】现代化应用的安全性至关重要,OAuth2 作为实现认证和授权的标准协议之一,被广泛采用。Spring 框架通过 Spring Security 提供了强大的 OAuth2 支持,简化了集成过程。本文将通过问答形式详细介绍如何在 Spring 应用中集成 OAuth2,包括 OAuth2 的基本概念、集成步骤及资源服务器保护方法。首先,需要在项目中添加 `spring-security-oauth2-client` 和 `spring-security-oauth2-resource-server` 依赖。
49 0
|
3月前
|
消息中间件 分布式计算 Kafka
MaxCompute 在实时数据分析中的角色
【8月更文第31天】随着大数据应用场景的不断扩展,对数据处理速度的要求越来越高,传统的批处理模式已经难以满足某些业务对实时性的需求。在这种背景下,实时数据处理成为了大数据领域的研究热点之一。阿里云的 MaxCompute 虽然主要用于离线数据处理,但通过与其他实时流处理系统(如 Apache Flink 或 Kafka Streams)的集成,也可以参与到实时数据分析中。本文将探讨 MaxCompute 在实时数据分析中的角色,并介绍如何将 MaxCompute 与 Flink 结合使用。
79 0
|
21天前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
22天前
|
分布式计算 关系型数据库 MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
44 3