人工智能平台PAI使用问题之如何指定线上分区表的分区格式-阿里云开发者社区

人工智能平台PAI使用问题之如何指定线上分区表的分区格式

2024-07-29 250

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台，旨在降低AI开发门槛，加速创新，助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务，共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述，涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

问题一：机器学习PAI的EasyRec主流支持的算法有哪些类别，每个类别下分别有哪些？

机器学习PAI的EasyRec主流支持的算法有哪些类别，每个类别下分别有哪些？

参考答案：

要不就是文件被删除，要么就是文件路径有问题

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/586364

问题二：目前比较好用的机器学习PAI推荐算法有哪些？

目前比较好用的机器学习PAI推荐算法有哪些？

参考答案：

阿里云机器学习PAI平台提供了丰富的推荐算法工具，包括EasyRec算法库和推荐Plus模块。EasyRec算法库中包含了DeepFM、DIN、MultiTower及DSSM等经典的推荐排序和召回算法。这些算法能够帮助您在PAI平台上快速训练推荐算法模型、验证模型效果以及进行模型部署。

另一方面，推荐Plus模块主要针对召回算法进行了优化。目前，它推荐了三个主要的召回算法，分别是Etrec（i2i）、GeaphSage（u2i）和ALS（u2i）。其中，i2i和u2i的主要区别在于，i2i是已有一定Item的推荐系统中推荐相似的Item。

此外，深度学习在搜广推领域的应用也已经非常深入，并且给各种场景的效果带来了巨大的提升。因此，在选择适合的推荐算法时，您还可以考虑使用深度学习相关的算法。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/586362

问题三：请教一下机器学习PAI -Dinput_table，如果是线上分区表，指定分区的格式？

请教一下机器学习PAI -Dinput_table，如果是线上分区表，指定分区的格式？

参考答案：

在Dataworks中使用EasyRec时，如果输入的表是线上分区表，可以通过在-Dinput_table参数中指定分区的格式来进行设置。具体的格式可以根据表的分区字段类型和分区值的格式来确定，常见的格式包括日期格式（如yyyy-MM-dd）、时间戳格式（如yyyy-MM-dd HH:mm:ss）等。根据具体情况，可以使用类似以下的格式进行指定：

-Dinput_table=表名/分区字段=分区值

例如，如果分区字段为date，分区值为2020-01-01，则可以使用以下格式进行指定：

-Dinput_table=表名/date=2020-01-01

需要根据实际情况进行具体的分区格式指定

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/586358

问题四：请教下机器学习PAI，训练如果想用3个worker是不是就要配4个worker？

请教下机器学习PAI，node1如果只做eval，训练如果想用3个worker是不是就要配4个worker？

我看现在node1好像只做eval?

参考答案：

是的

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/586357

问题五：我机器学习PAI的seq1，seq2特征有进入senet吗?

我机器学习PAI的seq1，seq2特征有进入senet吗?比如我写的配置类似

feature_groups {

group_name: "all"

feature_names: "a"

feature_names: "b"

feature_names: "c"

feature_names: "d"

wide_deep: DEEP

sequence_features: {

group_name: "seq1"

allow_key_search: false

need_key_feature:false

allow_key_transform:false

transform_dnn:false

tf_summary: false

seq_att_map: {

key: "item1"

hist_seq: "item_seq1"

}

sequence_features: {

group_name: "seq2"

allow_key_search: false

need_key_feature:false

allow_key_transform:false

transform_dnn:false

tf_summary: false

seq_att_map: {

key: "item2"

hist_seq: "item_seq2"

}

backbone {

blocks {

name: 'all'

inputs {

feature_group_name: 'all'

}

input_layer {

only_output_feature_list: true

}

blocks {

name: "senet"

inputs {

block_name: "all"

}

keras_layer {

class_name: 'SENet'

senet {

reduction_ratio: 4

}

参考答案：

你这样写就是做要attention之后再进senet，一般sequence不需要进senet，建议分开配

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/586352

人工智能平台PAI使用问题之如何指定线上分区表的分区格式

问题一：机器学习PAI的EasyRec主流支持的算法有哪些类别，每个类别下分别有哪些？

问题二：目前比较好用的机器学习PAI推荐算法有哪些？

问题三：请教一下机器学习PAI -Dinput_table，如果是线上分区表，指定分区的格式？

问题四：请教下机器学习PAI，训练如果想用3个worker是不是就要配4个worker？

问题五：我机器学习PAI的seq1，seq2特征有进入senet吗?

人工智能平台PAI

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景