机器学习PAI常见问题之部署报错如何解决

本文涉及的产品
模型训练 PAI-DLC,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,5000CU*H 3个月
简介: PAI(平台为智能,Platform for Artificial Intelligence)是阿里云提供的一个全面的人工智能开发平台,旨在为开发者提供机器学习、深度学习等人工智能技术的模型训练、优化和部署服务。以下是PAI平台使用中的一些常见问题及其答案汇总,帮助用户解决在使用过程中遇到的问题。

问题一:机器学习PAI alink不支持flink 1.13以上的版本吗?


机器学习PAI alink不支持flink 1.13以上的版本吗?可以自己编译源码来支持吗


参考回答:

是的。Alink支持的Flink版本为1.13。Alink提供了pyalink包,这个包对应于Alink所支持的最新Flink版本,也就是1.13。请注意,不同版本的Alink可能对应不同版本的Flink,因此,如果正在使用特定版本的Alink,需要确保它支持正在使用的Flink版本。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/598425


问题二:机器学习PAI在maxcompute调用PAI训练,不用pai-tf/deeprec的办法有吗?


机器学习PAI在maxcompute调用PAI训练,不用pai-tf/deeprec的办法有吗?

需要怎么操作?


参考回答:

https://easyrec.readthedocs.io/en/latest/quick_start/mc_tutorial.html 不是这种吗


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/599122


问题三:机器学习PAI部署这个: 但是部署时报错了,帮忙看看?


机器学习PAI部署这个: http://easyrec.oss-cn-beijing.aliyuncs.com/processor/LaRec-1.0.2a-v3-TF-2.10.1-Linux.tar.gz Process的包是这个看文档gpu推荐:T4、A10、3090或4090等GPU型号,但是部署时报错了,服务名:fs_adx_new_model_v3地域: 华北2


参考回答:

用的机器太老了,需要用g7系列的,g7系列以上的也可以


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/599123


问题四:机器学习PAI这种embedding特征的加入模型,写样本的时候json文件是怎么写吗?


机器学习PAI这种embedding特征的加入模型,写样本的时候json文件是怎么写吗?我现在这种写法{"expression": "user:open_emb", "feature_name": "open_emb", "feature_type": "raw_feature", "value_type": "String", "group": "user"},features中就只有embedding中的第一个数字


参考回答:

fg.json 你写成IdFeature吧,EasyRec的config再写成 RawFeature


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/599125


问题五:机器学习PAI中EasyRec里面,这样做的设计初衷是啥?


机器学习PAI中EasyRec里面,feature_column是把tensorflow的代码抄过来了一份,而不是直接用tf的。这样做的设计初衷是啥?


参考回答:

为了兼容低版本的tf运行时环境


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/599126

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
24天前
|
机器学习/深度学习 算法 开发工具
通义千问2(Qwen2)大语言模型在PAI-QuickStart的微调、评测与部署实践
阿里云的人工智能平台PAI,作为一站式的机器学习和深度学习平台,对Qwen2模型系列提供了全面的技术支持。无论是开发者还是企业客户,都可以通过PAI-QuickStart轻松实现Qwen2系列模型的微调、评测和快速部署。
|
8天前
|
机器学习/深度学习 人工智能 JSON
人工智能平台PAI产品使用合集之创建特征视图时遇到报错,该如何排查
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
8天前
|
机器学习/深度学习 人工智能 Java
人工智能平台PAI产品使用合集之已经通过自定义镜像部署了一个模型,想要上传并导入其他模型,该如何操作
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
7天前
|
机器学习/深度学习 存储 分布式计算
PAI机器学习平台如何进行分布式训练?
【7月更文挑战第1天】PAI机器学习平台如何进行分布式训练?
19 1
|
19天前
|
机器学习/深度学习 存储 人工智能
【机器学习】Samba-CoE实现高效推理部署
【机器学习】Samba-CoE实现高效推理部署
53 5
|
27天前
|
机器学习/深度学习 人工智能 Apache
人工智能平台PAI操作报错合集之alink任务可以在本地运行,上传到flink web运行就报错,如何解决
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。
|
27天前
|
机器学习/深度学习 人工智能 分布式计算
人工智能平台PAI操作报错合集之在ODPS的xxx_dev项目空间调用easyrec训练,需要访问yyy项目空间的OSS,出现报错,是什么导致的
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。
|
27天前
|
人工智能 分布式计算 调度
人工智能平台PAI产品使用合集之Stable Diffusion如何部署
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
27天前
|
机器学习/深度学习 人工智能 分布式计算
人工智能平台PAI操作报错合集之遇到报错:PANGU_FILE_NOT_FOUND?如何解决
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。
|
27天前
|
机器学习/深度学习 人工智能 并行计算
人工智能平台PAI操作报错合集之version选了0.7.5并在使用learn_loss_weight时遇到报错,如何解决
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。

热门文章

最新文章

相关产品

  • 人工智能平台 PAI