文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 文章正文

【MaxCompute】基于Package跨项目访问资源实践

2023-03-21 638

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 目前随着公司业务的不断扩展，各个业务线的数据也越来越多，如果所有数据都集中管理比较错综复杂。MaxCompute的跨项目访问资源比较适合这样的场景。每个业务线创建对应的project，自行管理数据。如果有需要访问其他业务线数据的诉求，可以基于Package实现数据共享的诉求，下面我们来介绍下基于Package实现跨项目访问资源的具体操作，本文以共享自建udf函数为例。

背景

目前随着公司业务的不断扩展，各个业务线的数据也越来越多，如果所有数据都集中管理比较错综复杂。MaxCompute的跨项目访问资源比较适合这样的场景。每个业务线创建对应的project，自行管理数据。如果有需要访问其他业务线数据的诉求，可以基于Package实现数据共享的诉求，下面我们来介绍下基于Package实现跨项目访问资源的具体操作，本文以共享自建udf函数为例。

前期准备

MaxCompute项目projectA 和 projectB，详情参考新建MaxCompute项目；
子账号 A（projectA开发环境任务发布人），详情参考子账号创建；
子账号 B（projectA生产环境任务执行人，可为主账号或权限较高的子账号）；
子账号 C（projectB跨项目访问人）；
projectA准备udf所有的jar包、表和函数，详情参考 MaxCompute udf。

步骤

账号权限明细

子账号 A（projectA开发环境任务发布人）：普通开发人员
子账号 B（projectA生产环境任务执行人）：除主账号外权限最高的管理者
子账号 C（projectB跨项目访问人）：普通开发人员，详情参考权限管理

步骤一：子账号A 创建package任务并发布生产

1. 登录DataWorks 数据开发，创建SQL节点，创建package任务，详情可参考 ODPS SQL节点。

DataWorks创建package任务.png

2. 修改项目责任人（如果有专人执行生产任务可执行此步骤）

在数据开发页面，单击业务流程后的图标，进入任务列表页面。
修改责任人

3. 提交发布任务

提交

发布

发布.png

可在发布列表中查看

发布列表中查看.png

步骤二：子账号B 执行生产任务

1.子账号B登录DataWorks运维中心，周期任务运维 - 周期任务，详情可参考 DataWorks运维中心。

DataWorks运维中心.png

2.子账号B执行任务

右键任务 - 测试，详情可参考周期任务运维

测试.png

选择业务日期

选择业务日期.png

查看运行结果

查看运行结果.png

步骤三：子账号C 使用package

1.主账号或管理员（Super_Administrator 或者 Admin）登录 projectB，安装package 并允许子账号C 访问 package，详情可参考基于package跨项目访问资源。

基于 package跨项目访问资源.png

2.子账号C 登录 projectB，进行package访问

查看package的资源列表

查看package资源列表.png

使用udf函数

使用udf函数.png

lQLPJxZt8w2hn7PNBAHNCkGwYhMu6WTj60YCtTUa9oCuAA_2625_1025.png

文章标签：

云原生大数据计算服务 MaxCompute

Java

分布式计算

SQL

运维

数据安全/隐私保护

MaxCompute

DataWorks

关键词：

云原生大数据计算服务 MaxCompute实践

云原生大数据计算服务 MaxCompute资源

云原生大数据计算服务 MaxCompute项目

云原生大数据计算服务 MaxCompute跨项目

云原生大数据计算服务 MaxCompute package

相关实践学习

基于MaxCompute的热门话题分析

Apsara Clouder大数据专项技能认证配套课程：基于MaxCompute的热门话题分析

杨越意

目录

相关文章

青云交（Java大数据AI云原生Python）

|

11月前

|

存储数据采集搜索推荐

Java 大视界 -- Java 大数据在智慧文旅旅游景区游客情感分析与服务改进中的应用实践（226）

本篇文章探讨了 Java 大数据在智慧文旅景区中的创新应用，重点分析了如何通过数据采集、情感分析与可视化等技术，挖掘游客情感需求，进而优化景区服务。文章结合实际案例，展示了 Java 在数据处理与智能推荐等方面的强大能力，为文旅行业的智慧化升级提供了可行路径。

青云交（Java大数据AI云原生Python）

441 0 0

Java 大视界 -- Java 大数据在智慧文旅旅游景区游客情感分析与服务改进中的应用实践（226）

Aron_NeAr

|

11月前

|

数据采集 SQL 搜索推荐

大数据之路：阿里巴巴大数据实践——OneData数据中台体系

OneData是阿里巴巴内部实现数据整合与管理的方法体系与工具，旨在解决指标混乱、数据孤岛等问题。通过规范定义、模型设计与工具平台三层架构，实现数据标准化与高效开发，提升数据质量与应用效率。

Aron_NeAr

3369 0 0

大数据之路：阿里巴巴大数据实践——OneData数据中台体系

Aron_NeAr

|

12月前

|

数据采集存储大数据

大数据之路：阿里巴巴大数据实践——日志采集与数据同步

本资料全面介绍大数据处理技术架构，涵盖数据采集、同步、计算与服务全流程。内容包括Web/App端日志采集方案、数据同步工具DataX与TimeTunnel、离线与实时数仓架构、OneData方法论及元数据管理等核心内容，适用于构建企业级数据平台体系。

Aron_NeAr

1167 1 2

1062754335

|

12月前

|

数据采集分布式计算 DataWorks

ODPS在某公共数据项目上的实践

本项目基于公共数据定义及ODPS与DataWorks技术，构建一体化智能化数据平台，涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理，强化数据安全与流通，提升业务效率与决策能力，助力数字化改革。

1062754335

411 4 4

Aron_NeAr

|

12月前

|

分布式计算监控大数据

大数据之路：阿里巴巴大数据实践——离线数据开发

该平台提供一站式大数据开发与治理服务，涵盖数据存储计算、任务调度、质量监控及安全管控。基于MaxCompute实现海量数据处理，结合D2与DataWorks进行任务开发与运维，通过SQLSCAN与DQC保障代码质量与数据准确性。任务调度系统支持定时、周期、手动运行等多种模式，确保高效稳定的数据生产流程。

Aron_NeAr

513 0 0

大数据之路：阿里巴巴大数据实践——离线数据开发

LucianaiB

|

12月前

|

分布式计算 DataWorks 数据处理

在数据浪潮中前行：记录一次我与ODPS的实践、思考与展望

本文详细介绍了在 AI 时代背景下，如何利用阿里云 ODPS 平台（尤其是 MaxCompute）进行分布式多模态数据处理的实践过程。内容涵盖技术架构解析、完整操作流程、实际部署步骤以及未来发展方向，同时结合 CSDN 博文深入探讨了多模态数据处理的技术挑战与创新路径，为企业提供高效、低成本的大规模数据处理方案。

LucianaiB

503 3 3

牧羊吖

|

12月前

|

机器学习/深度学习存储分布式计算

ODPS驱动电商仓储革命：动态需求预测系统的落地实践

本方案基于ODPS构建“预测-仿真-决策”闭环系统，解决传统仓储中滞销积压与爆款缺货问题。通过动态特征工程、时空融合模型与库存仿真引擎，实现库存周转天数下降42%，缺货率下降65%，年损减少5000万以上，显著提升运营效率与GMV。

牧羊吖

1108 1 1

Aron_NeAr

|

11月前

|

存储 SQL 分布式计算

大数据之路：阿里巴巴大数据实践——元数据与计算管理

本内容系统讲解了大数据体系中的元数据管理与计算优化。元数据部分涵盖技术、业务与管理元数据的分类及平台工具，并介绍血缘捕获、智能推荐与冷热分级等技术创新。元数据应用于数据标签、门户管理与建模分析。计算管理方面，深入探讨资源调度失衡、数据倾斜、小文件及长尾任务等问题，提出HBO与CBO优化策略及任务治理方案，全面提升资源利用率与任务执行效率。

Aron_NeAr

763 0 0

basu2023

|

9月前

|

人工智能 Cloud Native 算法

拔俗云原生 AI 临床大数据平台：赋能医学科研的开发者实践

AI临床大数据科研平台依托阿里云、腾讯云，打通医疗数据孤岛，提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术，实现跨机构协作与高效训练，助力开发者提升科研效率，推动医学AI创新落地。（238字）

basu2023

575 7 7

刘大猫.

|

12月前

|

JSON 分布式计算大数据

springboot项目集成大数据第三方dolphinscheduler调度器

springboot项目集成大数据第三方dolphinscheduler调度器

刘大猫.

752 3 3

大数据与机器学习

大数据计算 MaxCompute

热门文章

最新文章

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

吴刚专访--大数据和 MaxCompute 技术和故事

2017杭州云栖大会FAQ（持续更新中）

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

干货：解码OneData，阿里的数仓之路。

阿里云MaxCompute 2019-5月刊

［ETL实践指南］基于Kettle的MaxCompute插件实现数据上云

Spark SQL 函数分类导航

#Nginx教程 Nginx作为目前最流行的高性能Web服务器和反向代理服务器，凭借其高并发、低内存消耗的特点，被广泛应用于各类生产环境。本文将从零开始，带你快速掌握Nginx的核心配置与实战技巧。

金融行情系统中，API 接入常见的 5 个工程问题

寻找 AI 全能王——阿里云 Data+AI 工程师全球大奖赛正式开启

网站代码网站源代码网页源代码网页代码网站

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

【跨国数仓迁移最佳实践7】基于 MaxCompute 多租的大数据平台架构

ODPS 十五周年实录 | Data + AI，MaxCompute 下一个15年的新增长引擎

【跨国数仓迁移最佳实践6】MaxCompute SQL语法及函数功能增强，10万条SQL转写顺利迁移

诊断设备企业必看！垂直医疗行业的CRM软件有哪些？

相关产品

云原生大数据计算服务 MaxCompute

文档详情产品详情

相关课程

更多

大数据Impala教程

大数据Spark2020最新课程（知识精讲与实战演练）第二阶段

大数据Spark2020版（知识精讲与实战演练）第三阶段

大数据Spark2020版（知识精讲与实战演练）第四阶段

2020版大数据实战项目之DMP广告系统（第二阶段）

2020版大数据实战项目之DMP广告系统（第四阶段）

相关电子书

更多

MaxCompute Serverless 架构演进

Data+AI时代大数据平台应该如何建设

大数据AI一体化的解读

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！