机器学习PAI的合并列输出是什么?交集还是并集?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在阿里云机器学习平台PAI中,合并列算法组件的功能是将两张表的数据按列进行合并。根据知识库中的描述,合并列的操作既不是简单的交集,也不是并集,而是将两张表的列按照指定规则进行拼接,生成一个新的输出表。
行数要求:
列的选择与拼接:
outputTableColNames
重新命名。selectedColNamesList
,则默认选择两张表的所有列进行合并。输出表的内容:
col0, col1, col2, col3, col4
),右表有5列(col10, col11, col12, col13, col14
),则输出表将包含10列(col0, col1, ..., col14
)。自动命名选项:
autoRenameCol
控制是否对输出表的列进行自动命名。如果设置为true
,则输出表的列名会自动生成,忽略outputTableColNames
参数。以下是一个具体的示例,展示了合并列的输出结果:
col0:bigint | col1:double | col2:string | col3:Datetime | col4:Boolean |
---|---|---|---|---|
10 | 0.0 | aaaa | 2015-10-01 00:00:00 | TRUE |
11 | 1.0 | aaaa | 2015-10-01 00:00:00 | FALSE |
col10:bigint | col11:double | col12:string | col13:Datetime | col14:Boolean |
---|---|---|---|---|
110 | 10.0 | 2aaaa | 2015-10-01 00:00:00 | TRUE |
111 | 11.0 | 2aaaa | 2015-10-01 00:00:00 | FALSE |
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 |
---|---|---|---|---|---|---|---|---|---|
10 | 0 | aaaa | 2015-10-01 00:00:00 | true | 110 | 10 | 2aaaa | 2015-10-01 00:00:00 | true |
11 | 1 | aaaa | 2015-10-01 00:00:00 | false | 111 | 11 | 2aaaa | 2015-10-01 00:00:00 | false |
从示例可以看出,输出表的列是两张输入表列的并集,且列的顺序与输入表的列顺序一致。
希望以上解答能够帮助您理解合并列算法的输出逻辑!
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。
你好,我是AI助理
可以解答问题、推荐解决方案等