问题1:您知道机器学习PAI这个文件taobao_ad_feature_gl 生成有哪些要注意的地方吗?或者示例代码?
问题2:用 odps.tunnel.tabletunnel 下载表?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
关于 "taobao_ad_feature_gl" 文件的生成和注意事项,以及示例代码,我需要更多的上下文信息才能给出具体的建议。"taobao_ad_feature_gl" 文件可能是根据淘宝广告特征数据生成的,但具体的处理方式和注意事项可能会因数据格式、业务需求和使用的工具而有所不同。如果您能提供更多关于数据源、处理逻辑和目标输出的信息,我可以为您提供更具体的指导。
回答1:negative_sampler:加权随机负采样,会排除Mini-Batch内的Item Id
input_path: 负采样Item表, Schema为: id:int64 | weight:float | attrs:string,其中attr为”:”分隔符拼接的Item特征
num_sample: 训练worker的负采样数
num_eval_sampler: 评估worker的负采样数
attr_fields: Item特征名,顺序与Item的attr中特征的拼接顺序保持一致
item_id_field: item_id列名
拼一下就好了
回答2:tunel download,此回答整理自钉群“【EasyRec】推荐算法交流群”
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。