阿里云 PAI 产品收入预测挖掘演示实验 | 学习笔记

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 快速学习阿里云 PAI 产品收入预测挖掘演示实验

开发者学堂课程【场景实践 - 基于机器学习进行收入预测分析:阿里云 PAI 产品收入预测挖掘演示实验】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/526/detail/7092


阿里云 PAI 产品收入预测挖掘演示实验


内容介绍:

一、简介

二、操作

 

一、简介

此实验用到的阿里云产品模块如下

首先登录阿里云网站之后,点击右上角的控制台。进入到阿里云管理控制台界面,

image.png

选择大数据数加菜单。选择 date works 菜单。点击之后。右侧会显示出所拥有的项目,选择对应的项目进入到工作区。

试验主要用到阿里云产品的两大功能模块, dataworks 和机器学习。 dataworks 里面主要用到数据开发和运维中心。

在数据开发模块里,可以直接新建任务、新建脚本来数据加工处理。

在运维中心里面看到新建的脚本的情况,手动实例跑数的一些相关记录。

image.png


二、操作

机器学习功能模块主要的一些操作。

点击机器学习之后,在右侧选择对应的项目进入到机器学习。然后点击实验。可以新建实验。新建实验之后,可以看到左侧列出的相关的组件。

image.png

此次实验所用到的一些组件比如读数据表组件、写数据表组件。

读数据表组件是继续学习预测基于哪些组件完成。

写数据表是指最终预测出来的结果写到电脑里面。

然后还会用到过滤映射组件。过滤映射组件是指从上面拿过来的数据,想做怎样的过滤。比如数据里面需求类型比较多,金融行业、互联网行业、房地产行业。如果只想分析互联网行业的数据,把数据表里面对应的字段右边做相关的过滤,直接选择互联网行业的自动控制。

缺失值填充组件是指数据可能会出现空值,把空值给映射成平均值或者最小值。然后此次用到的主要的时间序列组件是 x13_auto_arima 组件。时序列、数值列、分组列字段设置里面这三列。

时序列是列来进行排序。数值列是指基于哪一列来进行预测。分组链就是把哪些数据加上组进行相关的预测。

分组列的话是可选的列。一般情况下,开始日期不改变。频率十二就表示一年12个月,如果四就表示今年四个季度,如果是七,就表示周的频率

这个地方一般就直接用12,因为是月数据。

pq 最大值、季节性最大值、差分 d 最大值/季节性差分 d 最大值、差分 d 和季节性差分 d 是主要调整的值。

其实 x 13_auto_arima 主要就是来调整这些相关的参数,来适应相关的预算输出。执行调优一般就不需要做调整。

x13_auto_arima 会有两个输出装,所说的预测结果表和详细信息表。

最终整个流程部署完之后,就可以运行各个流程,检查是否符合要求。

image.png

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
10天前
|
人工智能 JSON 算法
魔搭支持在阿里云人工智能平台PAI上进行模型训练、部署了!
现在,魔搭上的众多模型支持在阿里云人工智能平台PAI-Model Gallery上使用阿里云算力资源进行模型训练和部署啦!
|
4天前
|
人工智能 自然语言处理 安全
通过阿里云Milvus与PAI搭建高效的检索增强对话系统
阿里云向量检索Milvus版是一款全托管的云服务,兼容开源Milvus并支持无缝迁移。它提供大规模AI向量数据的相似性检索服务,具备易用性、可用性、安全性和低成本等优势,适用于多模态搜索、检索增强生成(RAG)、搜索推荐、内容风险识别等场景。用户可通过PAI平台部署RAG系统,创建和配置Milvus实例,并利用Attu工具进行可视化操作,快速开发和部署应用。使用前需确保Milvus实例和PAI在相同地域,并完成相关配置与开通服务。
|
23天前
|
开发者 Python
阿里云PAI DSW快速部署服务
在使用阿里云DSW实例进行开发的时候,可能需要快速部署服务测试应用效果。DSW实例目前已经支持通过自定义服务访问配置功能,对外提供服务访问能力,您在应用开发过程中无需分享整个DSW实例,即可将服务分享给协作开发者进行测试和验证。
74 23
|
8天前
|
并行计算 PyTorch 算法框架/工具
阿里云PAI-部署Qwen2-VL-72B
阿里云PAI-部署Qwen2-VL-72B踩坑实录
|
29天前
|
机器学习/深度学习 人工智能 自然语言处理
【NeurIPS'24】阿里云 PAI 团队论文被收录为 Spotlight,并完成主题演讲分享
12月10日,NeurIPS 2024在温哥华开幕,阿里云PAI团队论文《PertEval: Unveiling Real Knowledge Capacity of LLMs with Knowledge-Invariant Perturbations》入选Spotlight,PAI团队还进行了“可信AI的技术解读与最佳实践”主题演讲,展示AI工程化平台产品能力。
|
8月前
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。
262 14
|
8月前
|
机器学习/深度学习 算法 数据可视化
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
149 1
|
8月前
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
|
8月前
|
机器学习/深度学习 数据采集 算法
解码癌症预测的密码:可解释性机器学习算法SHAP揭示XGBoost模型的预测机制
解码癌症预测的密码:可解释性机器学习算法SHAP揭示XGBoost模型的预测机制
367 0
|
8月前
|
机器学习/深度学习 数据采集 监控
机器学习-特征选择:如何使用递归特征消除算法自动筛选出最优特征?
机器学习-特征选择:如何使用递归特征消除算法自动筛选出最优特征?
1051 0