MaxCompute产品使用合集之大数据计算MaxCompute即使用相同的SQL语句在DataWorks和Tunnel上执行,结果却不同,如何解决

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

问题一:请问大数据计算MaxCompute 可以将文件保存在自己的本地电脑吗?

请问大数据计算MaxCompute dataworks通过python操作文件,可以将文件保存在自己的本地电脑吗?



参考答案:

DataWorks上没有办法。本地执行PyODPS才可以

本地搭建PyODPS环境参考下:https://help.aliyun.com/zh/maxcompute/user-guide/install-pyodps?spm=a2c4g.11186623.0.0.4e15514aVQFaQ3



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/568720



问题二:大数据计算MaxCompute java sdk 可以提交sql脚本吗?

大数据计算MaxCompute java sdk 可以提交sql脚本吗?



参考答案:

可以,参考下这里

https://help.aliyun.com/zh/maxcompute/user-guide/sdk-for-java?spm=a2c4g.11186623.0.i89#section-fpg-45b-wdb



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/568719



问题三:大数据计算MaxCompute如何在dataworks里面的--archives 使用解压缩?

大数据计算MaxCompute如何在dataworks里面的--archives ARCHIVES使用解压缩?或者如何导航到zip文件里面去?



参考答案:

直接引用文件就可以。 https://help.aliyun.com/zh/maxcompute/product-overview/resource?spm=a2c4g.11186623.0.i1#concept-fqd-ygb-5db



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/568718



问题四:大数据计算MaxCompute同样的sql,结果不一样;是什么原因知道吗?

大数据计算MaxCompute同样的sql,在dataworks和tunnel上面执行,结果不一样;是什么原因知道吗?https://logview.aliyun.com/logview?h=http://service.cn.maxcompute.aliyun.com/api&p=soterea_zj&i=20231106050547942g3nbs6bwi22&token=NlovNXJLQmVnOE5BV2thT2Z0dUVqc01mTjBNPSxPRFBTX09CTzoxOTA4MDEyMzM1MTA4NDcwLDE2OTk4NTE5NDgseyJTdGF0ZW1lbnQiOlt7IkFjdGlvbiI6WyJvZHBzOlJlYWQiXSwiRWZmZWN0IjoiQWxsb3ciLCJSZXNvdXJjZSI6WyJhY3M6b2RwczoqOnByb2plY3RzL3NvdGVyZWFfemovaW5zdGFuY2VzLzIwMjMxMTA2MDUwNTQ3OTQyZzNuYnM2YndpMjIiXX1dLCJWZXJzaW9uIjoiMSJ9&subQuery=1



参考答案:

看一下日志里的调度参数值和另外一个SQL里的ds = '20231105',是否一致吧



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/568717



问题五:大数据计算MaxCompute有没有办法判断 文本是不是纯数字?

大数据计算MaxCompute有没有办法判断 文本是不是纯数字?



参考答案:

没有直接的办法,可以通过正则匹配一下数字,把匹配不上的区分出来

https://help.aliyun.com/zh/maxcompute/user-guide/regular-expressions?spm=a2c4g.11186623.0.i82



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/568716

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 课程目标  通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者
相关文章
|
2天前
|
DataWorks 监控 数据建模
DataWorks产品体验评测
DataWorks产品体验评测
|
6天前
|
人工智能 分布式计算 DataWorks
大数据& AI 产品月刊【2024年12月】
大数据& AI 产品技术月刊【2024年12月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
4天前
|
数据采集 机器学习/深度学习 DataWorks
DataWorks产品评测:大数据开发治理的深度体验
DataWorks产品评测:大数据开发治理的深度体验
35 1
|
16天前
|
SQL DataWorks 大数据
DataWorks产品体验测评
一文带你了解DataWorks大数据开发治理平台的优与劣
123 11
|
23天前
|
数据采集 人工智能 DataWorks
DataWorks产品最佳实践测评
DataWorks产品最佳实践测评
|
19天前
|
分布式计算 DataWorks 监控
DataWorks产品体验评测、
DataWorks产品体验评测、
43 0
|
25天前
|
分布式计算 DataWorks 搜索推荐
DataWorks产品评测:大数据开发治理平台的最佳实践与体验
DataWorks是阿里云推出的一款大数据开发治理平台,集成了多种大数据引擎,支持数据集成、开发、分析和任务调度。本文通过用户画像分析的最佳实践,评测了DataWorks的功能和使用体验,并提出了优化建议。通过实践,DataWorks在数据整合、清洗及可视化方面表现出色,适合企业高效管理和分析数据。
88 0
|
1月前
|
SQL DataWorks 数据可视化
DataWorks产品体验与评测
在当今数字化时代,数据处理的重要性不言而喻。DataWorks作为一款数据开发治理平台,在数据处理领域占据着重要的地位。通过对DataWorks产品的体验使用,我们可以深入了解其功能、优势以及存在的问题,并且与其他数据处理工具进行对比,从而为企业、工作或学习中的数据处理提供有价值的参考。
62 6
DataWorks产品体验与评测
|
1月前
|
SQL DataWorks 搜索推荐
DataWorks产品评测与最佳实践体验报告
DataWorks是阿里巴巴云推出的一款高效数据处理平台,通过内置的数据集成工具和ETL功能,实现了多源数据的自动化处理与分析。本文介绍了DataWorks在用户画像分析中的应用实践,展示了其如何帮助企业高效管理数据资源,支持决策制定及营销优化。同时,文章还评测了DataWorks的产品体验,包括开通流程、功能满足度等方面,并与其它数据开发平台进行了比较,突出了DataWorks在易用性、性能和生态完整性上的优势。最后,对Data Studio新版本中的Notebook环境进行了初步探索,强调了其在提升开发效率方面的价值。
74 16
|
29天前
|
SQL 分布式计算 DataWorks
DataWorks产品测评|基于DataWorks和MaxCompute产品组合实现用户画像分析
本文介绍了如何使用DataWorks和MaxCompute产品组合实现用户画像分析。首先,通过阿里云官网开通DataWorks服务并创建资源组,接着创建MaxCompute项目和数据源。随后,利用DataWorks的数据集成和数据开发模块,将业务数据同步至MaxCompute,并通过ODPS SQL完成用户画像的数据加工,最终将结果写入`ads_user_info_1d`表。文章详细记录了每一步的操作过程,包括任务开发、运行、运维操作和资源释放,帮助读者顺利完成用户画像分析。此外,还指出了文档中的一些不一致之处,并提供了相应的解决方法。

相关产品

  • 云原生大数据计算服务 MaxCompute