文档备案控制台

开发者社区大数据与机器学习人工智能平台PAI 正文

请问机器学习PAI的alink支持keyby吗？

问题1：请问机器学习PAI的alink支持keyby吗？我要根据不同用户id训练模型输出结果。问题2：EcodOutlier4GroupbatchOp也可以有这个效果吗？

展开

收起

三分钟热度的鱼 2023-05-29 11:30:33 252 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

牧羊吖

月移花影，暗香浮动
问题一：是的，机器学习PAI的alink支持keyBy操作。keyBy操作是Flink中的一个非常重要的操作，用于将数据流按照指定的键（Key）进行分区，将具有相同Key的数据分到同一个分区中，这样在后续的操作中可以对同一分区内的数据进行各种计算和转换操作，增加处理效率。

在机器学习PAI的alink中，keyBy操作可以使用StreamDAG中的KeyByOp节点实现，例如下面的代码片段：
```
import ai_flow as af
from ai_flow_plugins.job_plugins.flink import FlinkJobConfig, FlinkPythonJob
from ai_flow_plugins.job_plugins.flink.flink_job_config import FlinkJobType

conf = FlinkJobConfig(job_name='flink job with keyBy',
job_type=FlinkJobType.PYTHON)

with af.config() as cfg:
source = af.user_define_operation(
executor=FlinkPythonJob(
package_path='flink_job_with_keyby.py',
job_class='FlinkJobWithKeyBy'
),
dag=af.current_dag(),
op_args={
'input': af.output_of(prev_op),
'output': example_path
},
job_config=conf
)

op_keyed = af.key_by(source, key=['key'], partition=1)

sink = af.hadoop_write(
input=op_keyed.output[0],
path=sink_path,
write_format=af.WriteFormat.CSV
)
```
其中，key_by函数接收一个Op节点以及一个键列表作为参数，返回一个KeyByOp节点，表示将Op节点生成的数据流按照键列表进行分区。

上述代码片段中使用了FlinkPythonJob来定义Flink作业，也可以使用其他类型的Flink作业和Flink任务。

问题二：EcodOutlier4GroupbatchOp不支持keyby功能。它是一个用于异常检测的组批量操作算子，可以将输入数据集分成若干组，在每个组内进行异常检测并输出异常结果。在进行异常检测时，EcodOutlier4GroupbatchOp根据输入数据集的schema和参数，对每个组内的样本进行单独的异常检测，不能使用keyby对数据进行分组。如果需要使用keyby对数据进行分组，可以使用其他支持keyby的算子，如GroupByKeyBatchOp等。
2023-05-29 11:47:23

赞同展开评论
圆不溜秋的小猫猫

针对问题1的回答：ECOD算法是支持的。EcodOutlierStreamOp 直接接这个，指定group参数就行了。针对问题2的回答：这个需要前边加groupbyop，聚合成mtable的，再EcodOutlier4GroupbatchOp才可以。此回答整理自钉群“Alink开源--用户群”

2023-05-29 11:45:24

赞同展开评论

问答分类：

机器学习/深度学习人工智能平台 PAI

问答标签：

机器学习人工智能平台 PAI 人工智能平台 PAI pai 人工智能平台 PAI alink 人工智能平台 PAI机器学习机器学习平台 PAIpai

问答地址：

开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 问答

相关问答

人工智能平台PAI

目前看阿里机器学习PAI都到1.18了。目前alink 的版本最近是否有更新计划？

305

1

0

机器学习PAI中ALink支持lightGBM么？

254

1

0

机器学习PAI alink支持图像识别吗？

266

1

0

机器学习PAI Alink支持往Minio直接写入文件吗，如果可以的话，这两个参数应该填什么呢？

173

1

0

机器学习PAI平台这个demo总是抱错，这个插件版本是上面那个alink版本吗？

213

1

0

我用alink连接hbase，redis之类的数据库一直报错。请问下机器学习PAI大概是什么问题？

335

0

0

我想问一下机器学习PAI，后续alink会推出conda方式的pyalink吗？

164

0

0

机器学习PAI执行Alink的job时，报错？

287

3

0

机器学习PAI Alink的在线学习组件支持LSTNet模型吗？

286

2

0

机器学习PAI怎么用Alink的相关方法解析取到metrics里的值？

205

2

0

大数据与机器学习

人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

我要提问

收录在圈子:

阿里云机器学习平台PAI

2443

+ 订阅

相关文章

Kimi K3 登陆阿里云百炼：2.8万亿参数旗舰模型，输入仅20元/百万Token

20元/百万Token！Kimi K3旗舰模型上架百炼，2.8万亿参数+百万上下文，性价比怎么算？

月之暗面 Kimi K3 接入百炼平台：100 万 Token 长文本，缓存仅 2 元 / 百万输入

阿里云百炼 Kimi K3 模型详解：多模态能力、限流参数、调用价格一览

一文读懂百炼 Kimi K3：2.8 万亿 MoE 模型、百万上下文、分层计费方案

热门讨论

热门文章

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

阿里云百炼大模型怎么收费？要钱吗？

如图，使用机器学习PAI报错是为什么？

在机器学习PAI偶发程序coredump后，gpu没被释放的问题，之前有遇到过吗？

AGENT平台工作流上传pdf通过图片内容理解识别不了

请问机器学习PAI这个错误可能是怎么导致的？

在机器学习PAI中execute时报了Failedtocollectopsdata错误咋解决？

机器学习PAI引用akdl三方库的flink-ml-framework,请问该库是否支持微软系统？

请问机器学习PAI的Alink可以加载预训练好的pytorch模型嘛？

机器学习PAI 中，出现这个报错是什么原因?

展开全部

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

【玩转数据系列六】文本分析算法实现新闻自动分类

阿里巴巴机器学习系列课程

基于对象特征的推荐

【玩转数据系列三】利用图算法实现金融行业风控

【玩转数据系列四】听说啤酒和尿布很配？本期教你用协同过滤做推荐

【玩转数据系列七】有娃的注意了，机器学习教您如何提高孩子学习成绩

基于协同过滤算法的推荐

FM算法介绍

【上报纸啦】95后大学生用机器学习PAI大战老年痴呆

展开全部

还有其他疑问?