文档备案控制台

开发者社区大数据与机器学习人工智能平台PAI 正文

我看正机器学习PAI常csv的数据的话，也得是这样的格式吗？

我看正机器学习PAI常csv的数据的话， Schema为: id:int64 | weight:float | attrs:string，其中attr为":"分隔符拼接的Item特征，要是mc表的话，也得是这样的格式吗？也还的把特征字段给用":"分隔符拼接的Item特征？

展开

收起

真的很搞笑 2024-06-18 12:54:06 226 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

芯在这

建议按照文档里的分隔符来，没有找到哪个参数能单独指定这个负采样表的分隔符；
之前那个参数可以直接照抄这里
https://github.com/alibaba/EasyRec/blob/98b7c8ca5aecfa98ba812d22c51084f2fe61e1f7/docs/source/train.md?plain=1#L141C3-L141C83 ，此回答整理自钉群“【EasyRec】推荐算法交流群”

2024-06-18 20:02:24

赞同展开评论
warmhearted

在处理机器学习PAI任务时，CSV数据的Schema定义确实对数据格式有明确要求，正如您提到的示例id:int64 | weight:float | attrs:string，其中attrs字段内容是由":"分隔的特征项CSV文件
。这表明在CSV文件中，每个特征或属性需按照指定的数据类型和格式组织

2024-06-18 17:22:02

赞同展开评论

问答分类：

机器学习/深度学习人工智能平台 PAI

问答标签：

人工智能平台 PAI数据人工智能平台 PAI格式人工智能平台 PAI数据格式人工智能平台 PAI csv数据人工智能平台 PAI csv格式

问答地址：

开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 问答

相关问答

人工智能平台PAI

机器学习PAI的featurestore里的行为序列为啥有的数据能查到有的数据查不到那？

178

1

0

函数计算FC用llama3.1模型训练XML格式的OpenDrive文件，效果不理想，怎么处理？

211

0

0

ModelScope的llama3.1模型训练XML格式的OpenDrive文件效果不理想，怎么办？

202

0

0

机器学习PAI生成trainset的时候，怎么指定编码格式？比如推荐系统常见的one-hot编码

246

1

0

机器学习PAI使用fg，生成的特征只能是这种拼接的格式吗，这种表分字段的形式不支持吗？

206

0

0

机器学习PAI训练数据的原始 hive表存在emr集群，pai如何才能组装好训练数据进行模型训练呢？

294

1

0

机器学习PAI的这个查不出数据，实时表里是有数据的，跟userid没有设置成user_id有关吗？

212

1

0

机器学习PAI的featureStore 数据没存进去，是为什么？

161

1

0

机器学习PAI有在Yitian上推理LLM的方案吗？

326

1

0

用max compute的资源，部署机器学习PAI环境，都可以仿照的方式了吗？

237

1

0

大数据与机器学习

人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

我要提问

相关文章

规则引擎+NLU混合架构 vs 纯大模型方案：单次对话成本差42%，你选哪个？

FlashAttention、PagedAttention两代注意力算法，改写大模型推理生态详解.186

DeepSeek V4 Flash 对标 Gemini 3.6，AI 大跑毒时代

2026最新测试岗薪资曝光：会训练AI的拿80万，只会写用例的在投简历

我用Python + SMTP搭建了一套自动化量化监控系统

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

数据守护：防勒索攻击数据保障

热门讨论

热门文章

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

阿里云百炼大模型怎么收费？要钱吗？

机器学习PAI中代码集管理代码配置这里的 git地址有啥要求吗 ?

机器学习PAI的Alink加载onnx模型和engine那个效率高呢

返回代码RISK.RISK_CONTROL_REJECTION

请问机器学习PAI的Alink可以加载预训练好的pytorch模型嘛？

AGENT平台工作流上传pdf通过图片内容理解识别不了

训练的时候是没问题的，所以为什么机器学习PAI会报错？

自定义机器人消息，curl: (35) TCP connection reset by peer

AI生成海报or人工手绘，哪个更戳你？

展开全部

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

阿里巴巴机器学习系列课程

【玩转数据系列三】利用图算法实现金融行业风控

机器学习PAI全新功效——实时新闻热点Online Learning实践

【玩转数据系列五】农业贷款发放预测

FM算法介绍

【上报纸啦】95后大学生用机器学习PAI大战老年痴呆

【图算法】金融风控实验

【通知】阿里云机器学习PAI即将商业化

基于画像的特征推荐

展开全部

还有其他疑问?