问题一:机器学习PAI能不能给下这两个文件,我看下样本怎么组织?
机器学习PAI能不能给下这两个文件,我看下样本怎么组织?train_input_path: "data/test/tb_data/taobao_pdn_fake_train_data"
eval_input_path: "data/test/tb_data/taobao_pdn_fake_test_data"
参考回答:
https://easyrec.readthedocs.io/en/latest/develop.html#id4 参考这个文档,获取测试数据
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/599134
问题二:机器学习PAI这里的inputs是在哪里获取的啊?
机器学习PAI中easy_rec.python.layers.keras.din.py,这里的inputs是在哪里获取的啊?inputs的顺序是在哪里调整为 keys, seq_len, query的?
参考回答:
貌似是通过这个block来预处理inputs
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/599135
问题三:机器学习PAI报错,怎么回事?
机器学习PAI报错?ValueError: Horovod has not been initialized; use hvd.init().https://logview.alibaba-inc.com/logview/?h=http://service.odps.aliyun-inc.com/api&p=tmall_rec_algo_dev&i=20240221094542905gcdp1dlvyg2_598ae623_b679_4309_86b5_94b83b42f129&token=NUVQK042clJjUWRtNW5wdldwNzU2ZGRIcHFzPSxPRFBTX09CTzoxMjc3MTA3OTI5OTEzMDQwLDE3MTExMDA3NDcseyJTdGF0ZW1lbnQiOlt7IkFjdGlvbiI6WyJvZHBzOlJlYWQiXSwiRWZmZWN0IjoiQWxsb3ciLCJSZXNvdXJjZSI6WyJhY3M6b2RwczoqOnByb2plY3RzL3RtYWxsX3JlY19hbGdvX2Rldi9pbnN0YW5jZXMvMjAyNDAyMjEwOTQ1NDI5MDVnY2RwMWRsdnlnMl81OThhZTYyM19iNjc5XzQzMDlfODZiNV85NGI4M2I0MmYxMjkiXX1dLCJWZXJzaW9uIjoiMSJ9
用的是demo的config,只是数据源改成了odps
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/599137
问题四:机器学习PAI将easyrec的predict的产出结果写到带有两个分区字段的表,这么写可以吗?
机器学习PAI将easyrec的predict的产出结果写到带有两个分区字段的表,这么写可以吗?
参考回答:
试试/dt=bizdate/tasktype={bizdate}/task_type={task_type} ,
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/599138
问题五:机器学习PAI是不是意味着对于TagFeature如果有一条样本的tag数超过10会截断到10呀?
机器学习PAI看到FeatureConfig里的lookup_max_sel_elem_num默认值是10,是不是意味着对于TagFeature如果有一条样本的tag数超过10会截断到10呀?
参考回答:
这个不影响TagFeature,只影响LookupFeature,LookupFeature的话建议用fg做效率比较高
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/599140