备案控制台

开发者社区大数据与机器学习人工智能平台PAI 正文

机器学习PAI看是在那个阶段出现的pb限制问题，这种情况下原始的pb应该就超过的2GB？

机器学习PAI看是在那个阶段出现的pb限制问题，新版本的bladedisc应该只有在tf圈图后导出子图编译时会使用pb，bladedisc编译完成后结果不会用pb来存储。这种情况下原始的pb应该就超过的2GB？（如果子图就超过了的话），一种可能的workaround方式时不freeze graph，这样const就不会被编译。另外老版本的bladedisc会使用pb来存储一部分编译后的结果，这个也会有可能超过2GB的限制，如果是这个问题，升级bladedisc应该可以解决。这个定位到是有一个input维度很大，超过了2g的限制，这个有好的处理方式吗？原生tf跑是没问题的

展开

收起

冰激凌甜筒 2023-05-02 22:01:59 275 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

LittlePenguin

随心分享，欢迎友善交流讨论：）

根据您提供的信息，这个问题可能出现在将 Tensorflow 圈图后导出的子图编译时使用 pb 文件来存储的阶段，而且可能是因为某个输入维度很大，超过了 2GB 的限制导致的。如果是这种情况，可以考虑以下一些解决方法：

不进行 Freeze Graph：如您所述，不进行 Freeze Graph 操作可以避免编译时将 const 存储到 pb 文件中，从而避免出现超出 2GB 限制的问题。不过这个方法可能会带来一些性能上的损失，需要根据具体情况进行评估。

修改输入维度：如果某个输入维度太大，超出了 2GB 限制，可以考虑缩小该维度的大小，或者使用更高效的数据结构来存储输入数据，如 sparse tensor。

使用分布式计算：如果单机无法处理大型模型和数据，可以考虑使用分布式计算。Tensorflow 提供了多种分布式计算方案，如 Horovod 和 TensorFlow Distribute。

升级 Bladedisc：如果使用的是老版本的 Bladedisc，可能会出现在编译时将结果存储到 pb 文件中的问题。可以尝试升级到新的版本，或者使用其他的编译方式，如预编译或 JIT 编译。

需要注意的是，以上方法可能会带来一些性能和复杂度上的损失，需要根据具体情况进行评估和选择。

2023-05-05 11:50:00

赞同展开评论

问答分类：

机器学习/深度学习存储人工智能平台 PAI

问答标签：

机器学习人工智能平台 PAI 人工智能平台 PAI pai 人工智能平台 PAI机器学习机器学习平台 PAIpai 机器学习平台 PAI pb

问答地址：

开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 问答

相关问答

人工智能平台PAI

如图机器学习PAI中的blink planner的问题怎么解决？

88

2

0

机器学习PAI中如果用udf,只上传一个protoc安装包，和proto 产出的pb文件就可以吗？

125

4

0

机器学习PAI easyrec中只有一个eval_path 评估数据的路径吗？

126

3

0

机器学习PAI easyrec做RawFeature这种连续值特征输入时，直接将特征原值作为输入？

106

3

0

现在机器学习PAI Alink最高适配到JDK的那个版本呢？

137

2

0

在机器学习PAI时将数据存到MySQL时数据量比较小时不能落库怎么办？

123

3

0

用机器学习PAI的easyrec训练产出的pb模型，在做离线预测时，可以帮忙看下是什么问题吗？

120

2

0

请问机器学习PAI这个服务内存占用没到上限96GB，内存占比却超过100%是为什么?

218

2

0

机器学习PAI其实我第一步export步骤导出来的*.pb模型，这可能是什么情况呢？

103

2

0

想问下机器学习PAI，这里有2.8吗？

90

2

0

大数据与机器学习

人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

我要提问

相关文章

CMSIS-NN：ARM Cortex-M处理器的高效神经网络内核——论文解读

《云原生微服务治理进阶：隐性风险根除与全链路能力构建》

SQL删除操作性能分析：移除300万条记录所需时间估算

Java语言操作INI配置文件策略

μNAS：面向微控制器的约束神经架构搜索——论文解读

热门讨论

热门文章

在api调用夸克搜索时，遇到权限不足问题

iTAG阿里的数据标注任务怎么对接呀？

ide中每次启动需要再次登录，非常麻烦

机器学习PAI我训练的AUC 0.7左右，这个效果是不是很差了？

通义千问 HTTP请求多轮对话的方式是什么格式的，文档里的没法实现，需要帮助，谢谢

使用通义灵码时，对话框字体怎么设置？

使用websocket请求asr 返回40000002错误码

机器学习PAI的Alink有界面吗？

Intellij idea如何配置通义灵码

阿里云的镜像上搜不到机器学习PAI的input用的common_io为什么？

展开全部

【玩转数据系列三】利用图算法实现金融行业风控

机器学习PAI全新功效——实时新闻热点Online Learning实践

【玩转数据系列五】农业贷款发放预测

【玩转数据系列十一】机器学习PAI眼中的《人民的名义》

推荐系统之冷启动问题

如何使用阿里云机器学习PAI的离线周期性调度功能

PAI智能答疑机器人上线啦

ALS算法实现用户音乐打分预测

利用PAI-DSW访问Github, 快速获取最新的学习资源

test_multiEvaluation

展开全部

还有其他疑问?