基于阿里云平台的人力资源流动大数据分析(三)

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 在这一部分,我们将依托于阿里云的MaxCompute和PAI平台,对人力资源流动数据进行分析建模。

再对数据进行探查以后,我们依托于阿里云PAI查看所有变量间的相关系数,找出相关系数最高的两个变量,得到相关系数矩阵如下:
image.png

由图可知 average_monthly_hours和time_spend_company 两变量与last_evaluation间的的相关系数分别为0.35和0.34 ,对last_evaluation影响较为显著,而其他各个变量间最大相关系数为0.42<0.95,可以认为解释变量间的多重共线性影响不大,因此不需要剔除。

然后我们将数据按照8:2的比例拆分为训练集和测试机,在训练集上进行模型训练,然后再测试集上查看模型的效果。模型训练的流程在PAI中构建如下:
image.png

在PAI上运行以后,得到的模型参数如下:

image.png

然后,在测试集上进行模型的测试,流程构建如下:
image.png

在PAI上运行以后,得到的测试结果如下:

image.png

由图可知该模型搭建效果较好。

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
智钢
+关注
目录
打赏
0
0
0
0
2
分享
相关文章
从湖仓分离到湖仓一体,四川航空基于 SelectDB 的多源数据联邦分析实践
川航选择引入 SelectDB 建设湖仓一体大数据分析引擎,取得了数据导入效率提升 3-6 倍,查询分析性能提升 10-18 倍、实时性提升至 5 秒内等收益。
从湖仓分离到湖仓一体,四川航空基于 SelectDB 的多源数据联邦分析实践
鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目
鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目
阿里云云计算ACA、大数据ACA、人工智能ACA三门认证升级调整公告
阿里云云计算ACA、大数据ACA、人工智能ACA三门认证升级调整公告
课时6:阿里云MaxCompute:轻松玩转大数据
阿里云MaxCompute是全新的大数据计算服务,提供快速、完全托管的PB级数据仓库解决方案。它拥有高效的压缩存储技术、强大的计算能力和丰富的用户接口,支持SQL查询、机器学习等高级分析。MaxCompute兼容多种计算模型,开箱即用,具备金融级安全性和灵活的数据授权功能,帮助企业节省成本并提升效率。
媒体声音|专访阿里云数据库周文超博士:AI就绪的智能数据平台设计思路
媒体声音|专访阿里云数据库周文超博士:AI就绪的智能数据平台设计思路
【4月重点功能发布】阿里云大数据+ AI 一体化平台
【4月重点功能发布】阿里云大数据+ AI 一体化平台
从数据小白到大数据达人:一步步成为数据分析专家
从数据小白到大数据达人:一步步成为数据分析专家
268 92
数据让农业更聪明——用大数据激活田间地头
数据让农业更聪明——用大数据激活田间地头
21 2

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等