开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

大数据计算MaxCompute使用pyodps 和 odpssql对mc表数据清洗处理 哪个效率高?

"1.大数据计算MaxCompute使用pyodps 和 odpssql对mc表数据进行清洗处理 哪个效率会高一些呢?
2.大数据计算MaxCompute mc的cte 产生的临时结果集 的生命周期有多长呢 可以在odps sql 节点 里面使用么?"

展开
收起
顾九思 2023-11-07 19:53:33 80 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    使用 pyodps 对 MaxCompute 表数据进行清洗处理一般比使用 odpssql 效率更高。原因如下:

    1. PyODPS 是一个 Python 包,支持所有 SQL 功能并提供了 DataFrame 等高级操作,比 odpsql 更适合于数据清洗。
    2. PyODPS 提供了一系列函数和模块,能够快速完成数据清洗任务。
    3. PyODPS 支持多线程处理,因此可以加快处理速度。
    2023-11-11 14:52:07
    赞同 展开评论 打赏
  • CTE(公共临时表)的存在时间是有限制的,一般是在一个SQL查询之内。因此,在同一个查询中可以多次引用相同的CTE。一般来说,ODPS SQL节点可以支持CTE的使用,

    2023-11-07 22:05:28
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关产品

  • 云原生大数据计算服务 MaxCompute
  • 相关电子书

    更多
    Data+AI时代大数据平台应该如何建设 立即下载
    大数据AI一体化的解读 立即下载
    极氪大数据 Serverless 应用实践 立即下载