备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

小打卡如何结合开源算法？

已解决

小打卡如何结合开源算法？

展开

收起

游客lmkkns5ck6auu 2022-08-16 15:00:41 403 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客c3gxxcx6cqeyo

推荐回答
PAI 提供的机器学习算法仍然有限，如果想要使用开源项目来实现算法部分怎么办呢？我们对此也做了尝试，我们则结合 MaxCompute+PAI+xLearn实现了基于 FM 算法的 CTR 预估模型。由于 xLearn 需要在单独的一台 ECS 上执行，那么问题就来了： 1. 如何从 MaxCompute 拉取数据，又如何上传结果？ MaxCompute 提供了 pyodps，可以很方便的使用 python 读写 MaxCompute的离线表。因此，我们在 python 循环检测 PAI 任务的特征工程结果表是否生成完成。生成完成，则启动下载数据和算法训练任务。算法执行结束后，则将模型文件通过 pyodps 写入 MaxCompute，当然也可以使用 tunnel 工具来完成。
1. 如何周期性调度？ DataWorks 上的任务与 ECS 上的任务，如何形成依赖关系？对于拉取，我们通过循环实现了 python 与 MaxCompute 表的依赖关系，那么算法训练完成了，DataWorks 的下游怎么知道呢？幸好，DataWorks 提供了 do-while 控制流组件，我们可以在 while 条件中检测模型表相应分区的数据是否存在了，在 do 组件中，则采用 shell 执行 sleep。跳出 while 后，则下游也开始正常执行了。之后便可以将模型和映射文件同步写入到 oss，以供后端使用了。
以上内容摘自《5天入门视觉AI》电子书，点击https://developer.aliyun.com/topic/download?id=31可下载完整版
2022-08-17 16:17:37

赞同展开评论

问答分类：

算法云原生大数据计算服务 MaxCompute

问答标签：

开源算法算法开源

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

机器学习PAI中EPL开源代码里面有实现这个算法吗？

116

1

0

平头哥的alios（rtos）有没有开源的图像处理算法？

244

4

0

EasyTransfer框架后续所有的算法都会开源到什么地方？

363

1

0

开源迁移学习框架EasyTransfer支持的主流算法是什么？

538

1

0

为什么要学习算法和数据结构？

1046

1

0

数据结构和算法的算法思路有哪些？

915

1

0

数据结构中顺序表的C 语言算法一般都会研究什么呢？

936

1

0

数据结构与算法中，快速排序的算法描述的具体内容是什么？

619

1

0

数据结构与算法中，选择排序的算法描述的具体内容是什么？

643

1

0

数据结构与算法中，冒泡排序的算法描述的具体内容是什么？

601

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

收录在圈子:

阿里巴巴大数据计算

347744

+ 订阅

MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库，以 Serverless 架构提供快速、全托管的在线数据仓库服务，消除了传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您可以经济并高效的分析处理海量数据。数以万计的企业正基于 MaxCompute 进行数据计算与分析，将数据高效转换为业务洞察。

相关文章

生成式 AI 必备：大模型备案全流程指南，覆盖语料安全 + 拒答能力评估

淘宝get_item V1详情优惠字段获取

AI领域优质知识类博主深度推荐：技术、商业与伦理的跨界布道者

基于深度学习YOLO12的汽车损伤检测系统

热门讨论

热门文章

请教个大数据计算MaxCompute问题，报这个错误是啥情况？

大数据计算MaxCompute 目前不支持其他格式的csv文件吗？

Dataworks中MaxCompute表怎么创建唯一索引啊?

大数据计算MaxCompute我对2个账户分别打开命令行，其中一个主账号操作完，这个是有延迟么？

DataWorks数据存储在maxcompute 表格式可以压缩吗可以设置存储副本数吗？

为从MaxCompute提取数据并写入Hologre，上面的SQL语句如何编写，可以提供一个示例吗？

大数据计算MaxCompute的Maxframe有什么官方的权限文档能参考么？

大数据计算MaxCompute的机器学习深度学习上gpu服务器资源怎么使用和配置？

请问大数据计算MaxCompute中有没有类似mysql中这样的设置事务级别的变量的方法？

大数据计算MaxCompute我这边想更改字段长度报错了？

展开全部

大数据环境下该如何优雅地设计数据分层

odps是什么?

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

品《阿里巴巴大数据实践-大数据之路》一书（上）

干货：解码OneData，阿里的数仓之路。

［ETL实践指南］基于Kettle的MaxCompute插件实现数据上云

MaxCompute常见错误汇总（更新ing）

品《阿里巴巴大数据实践-大数据之路》一书(下)

混合云模式下 MaxCompute + Hadoop 混搭大数据架构实践

阿里云机器学习平台的思考

展开全部

还有其他疑问?