DataWorks如何查看工作空间?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
登录DataWorks控制台。在左侧导航栏,单击工作空间列表。单击相应工作空间后的进入数据开发。单击左上方的图标,选择全部产品 > 数据治理 > 资源优化。在左侧导航栏,单击
工作空间资源优化。您可以单击顶部的工作空间下拉列表,选择相应的工作空间,也可以选择我的所有项目。工作空间资源优化页面为您展示工作空间资产概览和工作空间资源优化:您可以在工作空间资产概览查看工作空间下的总任务数和总表数。优化项变化趋势为您展示最近10天内可优化项的变化趋势,您可以在此查看最近完成可优化项的数量。说明 优化趋势中的数据是离线计算生成的,您可以查看最新的日期,以获取数据的最近更新时间。可优化计算排行和可优化存储排行最多展示10行信息。工作空间资源优化和个人资产优化的可优化项基本一致,只是查看的视角不同。
扫描领域 优化对象 可优化项 描述
数据存储 MaxCompute表 未管理的表 未管理的表需要满足以下两个校验条件:
空表 存储量为0的表即为空表。不建议您直接删除表,推荐您根据表的创建时间,对早期创建的表进行审计。
最近90天未访问表 最近90天未访问表的优化方案如下:
数据计算 MaxCompute任务 冲突任务 多个任务写入同一张表,可能导致不符合预期的结果。在数据开发过程中,不建议多个任务操作同一张表的同一个分区,避免其中一个任务报错,补数据时出现数据质量问题。 开发任务时,需要考虑数据幂等性问题。建议根据任务的下游数量,暂停其中一个任务,调整暂停任务下游节点的依赖关系。
数据倾斜 产生数据倾斜的根本原因是:有少数fuxi实例处理的数据量超过其它实例处理的数据量,导致少数实例的运行时长超过其它实例的平均运行时长,从而导致整个任务的运行时间较长,造成任务延迟。 数据倾斜的解决方案请参见其它计算
https://help.aliyun.com/document_detail/128410.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。