开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI上,为什么最后的结果中只保留了uuids,没有保留data列呢?

机器学习PAI上,我尝试将两个数据join在一起,为什么最后的结果中只保留了uuids,没有保留data列呢?
def041219a6fed253383fdf2b9eca0fd.png

展开
收起
2401。 2023-07-08 16:52:14 61 0
2 条回答
写回答
取消 提交回答
  • 在机器学习PAI上最后的结果中只保留了uuids列而没有保留data列,可能是由于数据处理过程中的某些步骤导致了这个结果。以下是一些可能的原因:

    1. 数据处理流程:在数据处理过程中,可能存在某个步骤或代码逻辑,导致只选择了uuids列而忽略了data列。请检查你的数据处理代码,在处理和转换数据时是否正确地选择了需要的列。

    2. 数据选择和筛选:如果在数据处理过程中使用了筛选、选择或切片操作,有可能只选择了uuids列而不包括data列。请确保你的代码正确地选择了需要的列,并且没有错误地排除了data列。

    3. 错误的列命名:检查你的代码中的列名称是否正确。有时候可能会出现列名称拼写错误或与实际数据不匹配的情况,导致你无法获取到data列的值。

    4. 数据丢失或删除:在数据处理过程中,可能意外地导致了data列的数据丢失或删除。请仔细检查你的代码和数据处理流程,确保没有出现意外的数据删除操作。

    为了解决这个问题,你可以仔细检查数据处理代码和流程,确保选择并保留了需要的列(包括uuids和data列)。还可以通过调试和打印中间结果来追踪数据的处理过程,找出具体导致data列丢失的原因。

    2023-07-31 17:53:59
    赞同 展开评论 打赏
  • 北京阿里云ACE会长

    这可能导致您看到的结果中只有uuids列而没有data列。

    为了保留join操作之前的所有列,您需要使用select操作选择需要的列。例如,以下是使用Flink的select操作选择需要的列的示例代码:

    val joined = table1.join(table2)
    .where('uuid).equalTo('uuid2)
    .select('uuid, 'data, 'data2)
    在上面的代码中,select操作选择了uuid、data和data2三列作为join操作的结果。这将保留join操作之前的所有列,并将其包含在最终结果中。

    2023-07-09 09:45:47
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    阿里巴巴机器学习平台AI 立即下载
    机器学习及人机交互实战 立即下载