文档备案控制台

开发者社区大数据与机器学习人工智能平台PAI 正文

机器学习PAI如果是定长的，为什么这个ParquetDataset这个接口直接指定字段名就行？

机器学习PAI如果是定长的DataFrame.Field('A', tf.int64, shape=[32])；如果是变长的，DataFrame.Field('A', tf.int64, ragged_rank=1)，为什么这个read_parquet接口需要指定字段类型，ParquetDataset这个接口直接指定字段名就行？

展开

收起

冰激凌甜筒 2023-04-25 17:05:05 425 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com

阿里云机器学习PAI中的ParquetDataset接口指定字段名是因为在Parquet文件中，每个字段都有其自己的元数据，包括字段名、数据类型、编码等信息。因此，ParquetDataset接口可以直接根据字段名来读取数据，而不需要知道数据的实际长度。这样可以大大简化数据读取的过程，提高数据读取的效率。同时，Parquet文件还支持列式存储，可以按需读取单个字段，进一步提高数据读取的速度和效率。

2023-04-25 21:58:42

赞同展开评论
微笑向日葵

参考文档https://deeprec.readthedocs.io/zh/latest/ParquetDataset.html与接口无关，看filename的类型，能直接拿到文件名的话可以解析文件，此回答整理自钉群“DeepRec用户群”

2023-04-25 19:26:05

赞同展开评论

问答分类：

机器学习/深度学习人工智能平台 PAI

问答标签：

机器学习人工智能平台 PAI 人工智能平台 PAI pai 人工智能平台 PAI机器学习人工智能平台 PAI接口机器学习平台 PAIpai

问答地址：

开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 问答

相关问答

人工智能平台PAI

机器学习PAI模型部署发布了。能否以http接口形式提供，给业务开发人员使用啊？

207

1

0

如图机器学习PAI中的blink planner的问题怎么解决？

200

2

0

机器学习PAI easyrec中只有一个eval_path 评估数据的路径吗？

262

3

0

机器学习PAI负采样的时候，有必要加上用户明确dislike的item吗？

261

3

0

请教关于机器学习PAI初始学习率，有推荐0.01的，这是有什么经验在里面吗?

650

3

0

机器学习PAI有API接口吗？如果要用其他语言来查询的话

172

1

0

机器学习PAI 这个接口参数是变了吗？

209

1

0

机器学习PAI 那个表是不是不能保证一致性？需要自己落或者掉这个callback接口？

207

1

0

想问下机器学习PAI，计算方式，是经验值吗？

217

2

0

机器学习PAI 我epoch设置了k,然后训练的时候还能到epoch>k的情况?

253

2

0

大数据与机器学习

人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

我要提问

相关文章

从“一句成片”到“长轨推演”：探究多模态智能体在长视频编辑中的应用

LangChain 视角的 Loop Engineering

HappyHorse 1.1 上线阿里云百炼：模型使用、核心能力与6折调用指南

Aloudata Agent 分析技能详解：从一个业务问题到一份可用分析

为什么Kriging 与高斯过程回归出自同一数学框架，但实际效果却差很远

热门讨论

热门文章

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

【百问百答】机器学习pai问答合集

请问在机器学习PAI里mc需要另外配置json函数库嘛？

返回代码RISK.RISK_CONTROL_REJECTION

在机器学习PAI中的alink中不支持的算法如果想扩展该如何实现呢？

想咨询下机器学习PAI 您在MIND里面关于squash的做法，这样加完向量模长还能控制到0-1吗？

阿里百炼大模型免费额度一点没有用，就直接收费了？

阿里云百炼大模型怎么收费？要钱吗？

请问机器学习PAI这个服务内存占用没到上限96GB，内存占比却超过100%是为什么?

AGENT平台工作流上传pdf通过图片内容理解识别不了

展开全部

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

【玩转数据系列七】有娃的注意了，机器学习教您如何提高孩子学习成绩

FM算法介绍

PAI实现的深度学习网络可视化编辑功能-FastNeuralNetwork

天猫精灵业务如何使用机器学习PAI进行模型推理优化

利用PAI-DSW访问Github, 快速获取最新的学习资源

雾霾天气预测

tt_0

阿里云PAI-EAS共享GPU，一卡部署多个模型（EasyRec/TorchEasyRec Processor）

AI Native平台，跨越AI应用从创新到生产的鸿沟

展开全部

还有其他疑问?