开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI kv特征的那个key,如果想分桶,只能先手动sql处理是吧?

机器学习PAI kv特征的那个key,如果想分桶,只能先手动sql处理是吧?

展开
收起
真的很搞笑 2023-11-05 16:29:16 71 0
1 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在使用PAI KV特征时,如果你想对 key 进行分桶操作,确实需要先使用SQL脚本或者其他方法进行预处理。这是因为PAI KV特征本身并不支持这种操作,它的作用主要是用于存储稀疏向量或稠密向量特征。
    如果你需要对 key 进行分桶,你可以在读取原始数据后使用SQL或其他方法进行处理,然后将处理后的数据作为PAI KV特征的输入。例如,你可以使用SQL的CASE WHEN语句来实现分桶操作:

    SELECT 
        CASE 
            WHEN key BETWEEN 0 AND 10 THEN 'bucket_0-10'
            WHEN key BETWEEN 11 AND 20 THEN 'bucket_11-20'
            ELSE 'other'
        END AS bucket,
        value
    FROM input_table;
    

    在这个例子中,我们将 key 分为了三个桶,分别是 'bucket_0-10','bucket_11-20' 和 'other'。你需要根据你的实际需求来调整这个分桶的规则。

    2023-11-05 16:33:13
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    微博机器学习平台架构和实践 立即下载
    机器学习及人机交互实战 立即下载
    大数据与机器学习支撑的个性化大屏 立即下载