人工智能平台PAI产品使用合集之负采样版本DSSM双塔模型训练好之后,怎么分别获取user tower的embedding和item tower的embedding

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

问题一:机器学习PAI ODPS默认是python2的version吗?

机器学习PAI ODPS默认是python2的version吗?我们看logviewe日志是python2.7



参考答案:

是的,ODPS默认使用的是Python 2.7。你在使用PAI命令进行模型训练或预测时,如果需要使用Python 3,可以在命令后面加上--py_version=3参数。例如:

paictl job submit pai_easyrec_trainer \
    --py_version=3 \
    ...

这样,PAI就会使用Python 3来进行模型训练或预测。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/570919



问题二:机器学习PAI在ODPS的PAI运行easy_rec,如何指定python版本为python3?

机器学习PAI在ODPS的PAI运行easy_rec,如何指定python版本为python3?



参考答案:

这个暂时还指定不了



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/570918



问题三:机器学习PAI 负采样版本DSSM双塔模型训练好之后,怎么分别获取?

机器学习PAI 负采样版本DSSM双塔模型训练好之后,怎么分别获取user tower的embedding和item tower的embedding?



参考答案:

需要切分模型https://help.aliyun.com/zh/pai/user-guide/vector-recall-split-model?spm=a2c4g.11186623.0.i4



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/570917



问题四:机器学习PAI item负采样表的weight字段,还在别的地方需要配置吗?

机器学习PAI item负采样表的weight字段,除了在负采样negative_sampler中要配置,还在别的地方需要配置吗?我组织好negative_sampler后,报weights字段找不到。negative_sampler的配置:

odps报的bug:



参考答案:

不是这样配的,或者你再看看文档。。attr_fields是你要告诉他item塔都用的什么特征。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/570914



问题五:机器学习PAI这个feature内支不支持中文配置?

机器学习PAI这个feature内支不支持中文配置?换句话说item侧的特征是需要我提前进行id化,还是easyrec会维护一套id化的方式?



参考答案:

可以input中文,不要自己id化.feature里面可以用中文, | 这个分隔符不要冲突。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/570913

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
2月前
|
机器学习/深度学习 人工智能 算法
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
玉米病害识别系统,本系统使用Python作为主要开发语言,通过收集了8种常见的玉米叶部病害图片数据集('矮花叶病', '健康', '灰斑病一般', '灰斑病严重', '锈病一般', '锈病严重', '叶斑病一般', '叶斑病严重'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。再使用Django搭建Web网页操作平台,实现用户上传一张玉米病害图片识别其名称。
72 0
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
|
3月前
|
机器学习/深度学习 算法 TensorFlow
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
交通标志识别系统。本系统使用Python作为主要编程语言,在交通标志图像识别功能实现中,基于TensorFlow搭建卷积神经网络算法模型,通过对收集到的58种常见的交通标志图像作为数据集,进行迭代训练最后得到一个识别精度较高的模型文件,然后保存为本地的h5格式文件。再使用Django开发Web网页端操作界面,实现用户上传一张交通标志图片,识别其名称。
125 6
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
基于PAI-QuickStart搭建一站式模型训练服务体验
【8月更文挑战第5天】基于PAI-QuickStart搭建一站式模型训练服务体验
148 0
|
5月前
|
存储 人工智能 弹性计算
|
5月前
|
人工智能 自然语言处理 算法
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|
5月前
|
存储 人工智能 物联网
|
5月前
|
机器学习/深度学习 存储 分布式计算
PAI机器学习平台如何进行分布式训练?
【7月更文挑战第1天】PAI机器学习平台如何进行分布式训练?
147 1
|
5月前
|
分布式计算 DataWorks 大数据
MaxCompute产品使用合集之如何实现嵌入式设备到物联网平台再到PAI DSW的云边结合
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
25天前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
77 4

相关产品

  • 人工智能平台 PAI
  • 下一篇
    DataWorks