文档备案控制台

开发者社区大数据与机器学习人工智能平台PAI 正文

机器学习PAI kv特征的那个key,如果想分桶，只能先手动sql处理是吧？

机器学习PAI kv特征的那个key,如果想分桶，只能先手动sql处理是吧？

展开

收起

真的很搞笑 2023-11-05 16:29:16 260 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
在使用PAI KV特征时，如果你想对 key 进行分桶操作，确实需要先使用SQL脚本或者其他方法进行预处理。这是因为PAI KV特征本身并不支持这种操作，它的作用主要是用于存储稀疏向量或稠密向量特征。
如果你需要对 key 进行分桶，你可以在读取原始数据后使用SQL或其他方法进行处理，然后将处理后的数据作为PAI KV特征的输入。例如，你可以使用SQL的CASE WHEN语句来实现分桶操作：
```
SELECT 
    CASE 
        WHEN key BETWEEN 0 AND 10 THEN 'bucket_0-10'
        WHEN key BETWEEN 11 AND 20 THEN 'bucket_11-20'
        ELSE 'other'
    END AS bucket,
    value
FROM input_table;
```
在这个例子中，我们将 key 分为了三个桶，分别是 'bucket_0-10'，'bucket_11-20' 和 'other'。你需要根据你的实际需求来调整这个分桶的规则。
2023-11-05 16:33:13

赞同展开评论

问答分类：

机器学习/深度学习 SQL 人工智能平台 PAI

问答标签：

人工智能平台 PAI特征机器学习人工智能平台 PAI 人工智能平台 PAI sql SQL机器学习机器学习SQL

问答地址：

开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 问答

相关问答

人工智能平台PAI

机器学习PAI这里的 KV 特征的分隔符 <GS> 具体是什么字符呢？

239

1

0

机器学习PAILookupFeature 取出来的值如果再分桶怎么配？

199

1

0

机器学习PAI dssm的negative_sample_v2 负采样版本，支持 kv结构的特征吗？

202

1

0

对于Flink CDC，Flink SQL方式定义表的时候那个PRIMARY KEY不是吗？

225

1

0

机器学习PAI自定义udtf，在sql中，不能用表字段传参给udtf函数吗？

224

0

0

flink sql数据写入kafka，会出现key为before、after及op，怎么把这些去掉？

658

3

0

机器学习PAI序列特征里面的值如果想做分桶该怎么配置啊？

224

0

0

机器学习PAI类别特征emb共享给kv特征这样写有问题吗？

179

1

0

机器学习PAI一个类别特征，emb共享序列特征和一个kv特征，我这种应该怎么办呢？

330

2

0

Flink中sql作业发送json格式到kafka，可以指定json里的key值吗？

495

1

0

大数据与机器学习

人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

我要提问

相关文章

分布式数据库三层架构详解：CN、DN、GMS 与全托管降运维 —— 阿里云 PolarDB-X

Apache Doris 4.1 全面增强 Iceberg：支持 UPDATE、MERGE INTO 与 Iceberg V3

动态定价：如何基于API实时数据自动调整售价？

物理复制比逻辑复制好在哪？数据库复制原理详解

芯片表面缺陷目标检测数据集：4类别、2,500张图像 | 目标检测

热门讨论

热门文章

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

阿里云百炼大模型怎么收费？要钱吗？

机器学习PAI中代码集管理代码配置这里的 git地址有啥要求吗 ?

如图，使用机器学习PAI报错是为什么？

在机器学习PAI偶发程序coredump后，gpu没被释放的问题，之前有遇到过吗？

请问机器学习PAI这个错误可能是怎么导致的？

机器学习PAI引用akdl三方库的flink-ml-framework,请问该库是否支持微软系统？

AGENT平台工作流上传pdf通过图片内容理解识别不了

在机器学习PAI中execute时报了Failedtocollectopsdata错误咋解决？

机器学习PAI alink 主要是CPU 消耗还是GPU消耗啊？

展开全部

【玩转数据系列六】文本分析算法实现新闻自动分类

【玩转数据系列三】利用图算法实现金融行业风控

基于对象特征的推荐

机器学习PAI全新功效——实时新闻热点Online Learning实践

【玩转数据系列五】农业贷款发放预测

【上报纸啦】95后大学生用机器学习PAI大战老年痴呆

PAI实现的深度学习网络可视化编辑功能-FastNeuralNetwork

【玩转数据系列十六】机器学习PAI通过声音分辨男女（含语音特征提取相关数据和代码）

阿里云机器学习平台PAI，助力降低机器学习的成本和技术门槛

【文本分析】新闻分类

展开全部

还有其他疑问?