问题一:机器学习PAI有大佬知道这个报错怎么解决吗?评估的时候报错!
问题1:机器学习PAI有大佬知道这个报错怎么解决吗?评估的时候报错
问题2:这种问题怎么进一步定位是哪个数据有问题
参考答案:
回答1:一般是tfrecord数据有问题
回答2:一般不是格式问题,就是tfrecord文件写的时候程序不正常,写一半异常终止了,或者文件系统的错误,导致无法解析
关于本问题的更多回答可点击进行查看:
问题二:机器学习PAI中model scope 部署到PAI上,Python sdk 报错?
机器学习PAI中model scope 部署到PAI上,Python sdk 报错?https://help.aliyun.com/zh/pai/use-cases/deploy-huggingface-and-modelscope-service-applications-with-one-click-of?spm=a2c4g.11186623.0.i0#790dec242a083![image.png](https://ucc.alicdn.com/pic/developer-ecology/wyvq5mjsckydw_f764e7f303144545b148b2e3c0a067ec.png)在线调试可以跑通![image.png](https://ucc.alicdn.com/pic/developer-ecology/wyvq5mjsckydw_e8e8ece2919641369288773c72bbd54e.png)
参考答案:
这个如果部署时选了ai-web应用的话,我们的sdk暂时还不支持这种链接的形式,有两个方法解决:1. 使用普通的客户端调用,比如:
import requests
import json
service_url = 'YOUR_SERVICE_URL'
token = 'TOKEN'
data = {"input": {"source_sentence": "你好"}}
result = requests.post(service_url, headers={"Authorization": token}, data=json.dumps(data))
print(json.loads(result.text))
- 部署的时候可以不选ai-web应用,选择镜像部署;
我们的sdk会尽快支持这个情况
关于本问题的更多回答可点击进行查看:
问题三:麻烦问下机器学习PAI,本地单机训练没问题,配了tf_config开启训练报这个错大概是啥问题?
tensorflow.python.framework.errors_impl.OperatorNotAllowedInGraphError: using a tf.Tensor
as a Python bool
is not allowed in Graph execution. Use Eager execution or decorate this function with @tf.function.
Exception ignored in: >
Traceback (most recent call last):
File "/venv/lib/python3.6/site-packages/tensorflow_core/python/training/server_lib.py", line 158, in del
AttributeError: 'NoneType' object has no attribute 'UnimplementedError'
麻烦问下机器学习PAI,本地单机训练没问题,配了tf_config开启train_distribute: PSStrategy训练报这个错大概是啥问题?
参考答案:
多机的地址要先自己配置好的,默认值是个示例
关于本问题的更多回答可点击进行查看:
问题四:机器学习PAI是这样改吗?我把tar包传到oss上了,还是报一样的错
机器学习PAI是这样改吗?我把tar包传到oss上了,还是报一样的错
关于本问题的更多回答可点击进行查看:
问题五:机器学习PAI-EAS部署的服务报CrashLoopBackOff错误如何处理
机器学习PAI-EAS部署的服务报CrashLoopBackOff错误如何处理
参考答案:
CrashLoopBackOff错误的原因是EAS框架的library与使用的library有符号冲突
注:2022-8-5 杭州地域已全量上线新版本,其他区域暂未发布全量。常见问题请参考PAI-EAS常见问题
关于本问题的更多回答可点击进行查看:
问题六:机器学习PAI使用序列特征是要保证等长吗?我这里报tensor shape的错误
机器学习PAI使用序列特征是要保证等长吗?我这里报tensor shape的错误
参考答案:
是的,要确保序列长度相同,大多数深度学习模型要求输入数据具有相同的维度和形状。 可以使用一些方法来确保所有的序列具有相同的长度,比如填充序列,截断序列。
关于本问题的更多回答可点击进行查看: