问题一:大数据计算MaxCompute udf内部可以执行odps sql 吗 ?
大数据计算MaxCompute udf内部可以执行odps sql 吗 ?
参考答案:
不行的哈,udf和sdk没办法一起用,产品有这个限制,没办法一起用。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/568738
问题二:能发份大数据计算MaxCompute Gdata数据模型设计规范我吗?
能发份大数据计算MaxCompute Gdata数据模型设计规范我吗?
参考答案:
MaxCompute是一个大数据计算平台,提供了丰富的数据存储和计算功能。在MaxCompute中,数据模型设计是进行数据存储、计算和管理的重要环节。然而,具体的Gdata数据模型设计规范可能因MaxCompute版本、业务需求和最佳实践而有所不同。
一般来说,在进行MaxCompute的Gdata数据模型设计时,可以参考以下规范和建议:
- 确定数据模型的设计目标:明确数据模型的设计目标,例如数据集成、数据分析、数据挖掘等,以便选择合适的数据模型和算法。
- 确定数据模型的维度:根据业务需求和数据特点,选择合适的维度来组织数据模型。例如,时间维度、地理维度、业务维度等。
- 定义数据模型的表结构:根据业务需求和数据特点,定义数据模型的表结构,包括表的字段、字段类型、索引等。
- 考虑数据的存储和计算性能:在定义表结构时,需要考虑数据的存储和计算性能。合理使用分区表、索引、数据分区等可以提高查询和计算的效率。
- 考虑数据的可扩展性:随着业务的发展和数据量的增加,需要考虑数据的可扩展性。合理规划表的分区分级、数据复制等可以提高数据的扩展性和可用性。
- 遵循数据的一致性和完整性规则:在定义表结构时,需要遵循数据的一致性和完整性规则,例如主键、外键等约束关系。
- 考虑数据的可维护性和可操作性:在定义表结构时,需要考虑数据的可维护性和可操作性。合理规划表的维护操作、数据备份和恢复等可以提高数据的可靠性和安全性。
以上是一般情况下进行MaxCompute的Gdata数据模型设计时可以参考的规范和建议。由于MaxCompute是一个企业级的大数据计算平台,具体的规范和最佳实践可能因特定版本、业务需求和实际场景而有所不同。因此,建议您参考MaxCompute的官方文档、最佳实践指南和技术支持团队的指导,以获取更准确和最新的规范和建议。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/568736
问题三:请问怎么设置大数据计算MaxCompute studio中脚本的参数 ‘?
请问怎么设置大数据计算MaxCompute studio中脚本的参数 ‘@@{yyyyMMdd}‘ ?
参考答案:
MaxCompute studio里不能用调度参数哈,调度参数是DataWorks里的概念
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/568734
问题四:大数据计算MaxCompute dataworks可以对数据集成任务进行批量修改数据源配置信息吗?
大数据计算MaxCompute dataworks可以对数据集成任务进行批量修改数据源配置信息吗?
参考答案:
我理解是不行,集成任务需要修改的话,只能单独修改。https://wx.dingtalk.com/invite-page/weixin.html?bizSource=____source____&corpId=dingd0cf799086f27cb135c2f4657eb6378f&inviterUid=A26F27643C000F2D94460A2FDF52346D&encodeDeptId=6B32040BBEAFAF1DE93FD50C752B256A
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/568732
问题五:请问大数据计算MaxCompute yarn-cluster模式是不是只能通过命令行启动呢?
请问大数据计算MaxCompute yarn-cluster模式是不是只能通过命令行启动呢?在IDEA上用sparkContext模式是不是启动不了的?
参考答案:
是的,要在spark客户端运行
关于本问题的更多回答可点击进行查看: