机器学习PAI理论上应是支持从hdfs上说数据呀, 好像并没有显式用--config=nohdfs,怎么回事?
阿里云机器学习PAI理论上是支持从HDFS上读取数据的。您可以在PAI Studio或者PAI CLI中使用HDFS的路径来指定数据路径。具体来说,您可以使用hdfs://开头的路径来指定HDFS上的数据,例如:
hdfs://your-hdfs-path/data.csv
如果您遇到了无法从HDFS上读取数据的问题,可能是由于您没有正确配置HDFS的访问权限或者网络连接不稳定等原因导致的。您可以检查一下您的HDFS配置和网络连接是否正常,或者尝试使用其他的数据源来进行测试。
编译开了的话,你在容器里另外配置好libhdfs.so的LD_LIBRARY_PATH的话应该就可以直接用dataset读,此回答整理自钉群“DeepRec用户群”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。