利用阿里云 PAI 进行收入预测挖掘分析 | 学习笔记

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 快速学习利用阿里云 PAI 进行收入预测挖掘分析

开发者学堂课程【场景实践 - 基于机器学习进行收入预测分析利用阿里云 PAI 进行收入预测挖掘分析】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/526/detail/7091


利用阿里云 PAI 进行收入预测挖掘分析

 

内容介绍:

一、任务背景

二、解决方案

三、任务与思考

 

一、任务背景

下面通过阿里云 dataworks 以及机器学习序列组件来完成如下实验,利用 PAI 挖掘分析。

首先来看任务背景。

通信企业 ABC 公司,他的客户分为个人客户和集团客户。为了适应集团客户发展的需要, ABC 公司结合集团客户的具体需求,梳理出针对集团客户的产品,售卖给各个集团客户。

然后集团客户根据客户的业务方向,可以划分为几个大行业。比如金融行业、房地产业、制造业和医疗行业。

而集团产品可以根据业务方向进行拆分。具体可以分为如下几个大类:固网类、宽带互联网类、数据传送类以及其他。

目前,相关集团产品有三年多的销售历史, ABC 公司有三年多的销售记录。

ABC 公司就希望可以根据已有的收入数据进行后续的收入预算。一方面可以更好的掌控收入进度,产生各个行业对企业收入的支撑力度。同时还能针对某些行业进行促销,来保证后续行业收入。

此次实验设计的业务数据主要有集团客户的历史收入数据。主要包括的信息有

月份、客户编码、名称、行业编码、总收入、过往来源收入、宽带互联网收入、数据传送类收入,其他收入。

image.png

本次试验的目的分两个部分。

第一个目的,根据提供的客户级别的数据,统计汇总各行业维度的汇总数据。

第二个目的,分析统计出来的行业维度汇总数据。针对某两个行业,比如房地产行业、id行业。通过已有的历史数据使用阿里云继续学习PAI产品,对这两个行业的后续收入数据计算。

 

二、解决方案

此次任务的解决方案。

第一步开通 dataworks 服务并搭建开发环境。

第二步。实验数据准备。分析实验提供的数据文件以及相关的数据表结构,就可以在建表,然后根据 date works 相关导入将提供的数据文件导入到新建的数据表里面。

下一步是设计数据加工流程。统一各项业务维度的汇总数据通过 word 来实现。根据业务理解,将明细数据进行统一汇总,这是第三步。

下一步通过时间序列算法进行收入预测,将上一步统一汇总数据输入。

比如通过缺失值填充组件、过滤映射组件对数据进行预处理。

然后再通过 x13_auto_arima 组件进行预测。需要根据具体的数据进行参数调整。调整 p dq 这三个参数。然后生成交易数据的预测值。

下一步是分析预测结果,将上一步的预测结果与实际值来进行比较。一般情况下,如果两者的差值在5%以内,是比较成功的预测,如果差距比较大,调整pdq重新预测。

最后一步,离线实验调度部署。完成时间序列预测之后,可以在 dataworks 里面进行调度配置。以便后续周期性法调度任务分享。

这个是最终的效果图。

image.png

左侧是通过阿里云机器学习产品实现序列,是收入预测的整体的过程。

右侧是通过时间序列组件进行预测的数据结果与真实的数据进行比较的情况

 

三、任务与思考

1.任务

完成了对房地产行业, IT 行业的总收入预测,根据已有的数据集统计汇总出金融行业、互联网、制造行业的数据传送类收入,进行后续月份收入预测。然后针对于每个行业挑选几个收入比较高的或者较低的客户,从客户的角度去进行收入预测。

2.思考

针对不同行业的同种类型的收入预测时,各行业预测对应的 p dq 参数是否是一样;或者针对某一行业的某个收入进行测试所捕获的dq值是否可以直接用于本行业其他收入的预测算法中?为什么?

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
6天前
|
存储 人工智能 云栖大会
【云栖大会】阿里云设计中心 × 教育部协同育人项目成果展,PAI ArtLab助力高校AIGC教育新路径
【云栖大会】阿里云设计中心 × 教育部协同育人项目成果展,PAI ArtLab助力高校AIGC教育新路径
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
云上一键部署通义千问 QwQ-32B 模型,阿里云 PAI 最佳实践
3月6日阿里云发布并开源了全新推理模型通义千问 QwQ-32B,在一系列权威基准测试中,千问QwQ-32B模型表现异常出色,几乎完全超越了OpenAI-o1-mini,性能比肩Deepseek-R1,且部署成本大幅降低。并集成了与智能体 Agent 相关的能力,够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。阿里云人工智能平台 PAI-Model Gallery 现已经支持一键部署 QwQ-32B,本实践带您部署体验专属 QwQ-32B模型服务。
|
6天前
|
人工智能 云栖大会
【云栖大会】阿里云PAI ArtLab x 通往AGI之路:ArtLab开源共创与商业落地
【云栖大会】阿里云PAI ArtLab x 通往AGI之路:ArtLab开源共创与商业落地
|
17天前
|
人工智能 自然语言处理 网络安全
基于阿里云 Milvus + DeepSeek + PAI LangStudio 的低成本高精度 RAG 实战
阿里云向量检索服务Milvus版是一款全托管向量检索引擎,并确保与开源Milvus的完全兼容性,支持无缝迁移。它在开源版本的基础上增强了可扩展性,能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警,Milvus云服务成为多样化AI应用场景的理想选择,包括多模态搜索、检索增强生成(RAG)、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作,进一步促进应用的快速开发和部署。
|
25天前
|
机器学习/深度学习 人工智能 开发者
DeepSeek服务器繁忙?拒绝稍后再试!基于阿里云PAI实现0代码一键部署DeepSeek-V3和DeepSeek-R1大模型
阿里云PAI平台支持零代码一键部署DeepSeek-V3和DeepSeek-R1大模型,用户可轻松实现从训练到部署再到推理的全流程。通过PAI Model Gallery,开发者只需简单几步即可完成模型部署,享受高效便捷的AI开发体验。具体步骤包括开通PAI服务、进入控制台选择模型、一键部署并获取调用信息。整个过程无需编写代码,极大简化了模型应用的门槛。
213 7
|
8天前
|
人工智能 监控 开发者
阿里云PAI发布DeepRec Extension,打造稳定高效的分布式训练,并宣布开源!
阿里云PAI发布DeepRec Extension,打造稳定高效的分布式训练,并宣布开源!
|
8天前
|
人工智能 自然语言处理 安全
基于阿里云向量检索 Milvus 版与 PAI 搭建高效的检索增强生成(RAG)系统
基于阿里云向量检索 Milvus 版与 PAI 搭建高效的检索增强生成(RAG)系统
|
10月前
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。
287 14
|
10月前
|
机器学习/深度学习 算法 数据可视化
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
178 1
|
10月前
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)

热门文章

最新文章