问题一:机器学习PAI序列特征怎么用共享emb呢?
机器学习PAI序列特征怎么用共享emb呢?
参考回答:
seq_combiner不影响的,你配上同样的combiner就可以了,在你的SequnceFeature里面再配上一个combiner
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/593336
问题二:机器学习PAI easyrec是不是没有长度为0的string型特征,处理成None的步骤啊?
机器学习PAI easyrec是不是没有长度为0的string型特征,处理成None的步骤啊
参考回答:
应该不能为None,所以填写为默认值,设置为“-1024” 之类的特殊默认值。空串好像不行。null才行。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/593338
问题三:机器学习PAI总是报错,是资源不够了吗?
机器学习PAI总是报错,是资源不够了吗?Your requested resource type [ecs.gn7i-c8g1.2xlarge] is not enough currently, please try other regions or other resource types
参考回答:
您请求的资源类型[ecs.gn7i-c8g1.2xlarge]目前不够,请尝试其他地区或其他资源类型
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/594041
问题四:机器学习PAI特征平台离线存储目前除了maxcompute外,支持其他类型的存储了吗?比如hive表
机器学习PAI特征平台离线存储目前除了maxcompute外,支持其他类型的存储了吗?比如hive表
参考回答:
机器学习PAI特征平台离线存储目前除了MaxCompute外,确实支持其他类型的存储,包括Hive表。
机器学习PAI(Platform for Artificial Intelligence)的特征平台提供了一个中心化的数据管理和共享平台,称为FeatureStore,用于组织、存储和管理机器学习和AI训练中使用的特征数据。FeatureStore支持在线数据源和离线数据源两种数据源,这意味着用户可以配置不同的数据源以适应不同的使用场景。
在离线存储方面,FeatureStore不仅支持阿里云的MaxCompute,还能与其他多种数据存储系统集成,包括但不限于Hive表。这样的设计使得FeatureStore能够灵活地与现有的大数据处理生态系统集成,为用户提供更加丰富的数据管理选项。通过这种方式,FeatureStore能够自动完成在线和离线表的构建,保证数据的一致性,并且能够在特征表只存一份的情况下,向多人共享特征。
综上所述,机器学习PAI特征平台的离线存储功能不仅限于MaxCompute,它已经扩展支持包括Hive表在内的其他类型存储,这为用户提供了更多的灵活性和选择。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/595371
问题五:机器学习PAI离线有支持emr hive表的计划吗?
机器学习PAI离线有支持emr hive表的计划吗?
参考回答:
机器学习PAI的离线服务目前并没有明确公布支持EMR Hive表的计划。
机器学习平台PAI提供了一系列的服务来支持机器学习的整个生命周期,包括数据处理、模型训练和预测等。在离线预测方面,PAI-EasyVision能够处理视频数据,并且支持图像相关的模型进行视频帧图像预测。这表明PAI在离线场景下确实提供了一定的功能支持。
然而,关于是否支持EMR Hive表的具体情况,目前的信息并没有直接说明。EMR是一个大数据平台,它支持Hadoop、Hive等开源大数据计算和存储引擎。虽然EMR和PAI都是阿里云提供的服务,但它们各自有不同的侧重点和应用场景。EMR主要用于处理大规模的数据集,而PAI则专注于机器学习工作流。
尽管如此,阿里云的其他服务如MaxCompute已经可以实现与Hive的数据集成,这可能为未来PAI与EMR Hive表之间的集成提供了技术上的可能性。此外,EMR的某些版本已经支持在Hive中查询Paimon中的数据,这表明在阿里云的服务生态中,不同服务之间的数据交互正在逐步增强。
综上所述,虽然目前没有明确的计划表明机器学习PAI会支持EMR Hive表,但考虑到阿里云服务之间不断增强的互操作性,这样的集成在未来是有可能实现的。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/595372