官方博客-第6页-阿里云开发者社区

  • 2024-05-15
    65575

    阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

    Apache Paimon 和 Apache Hudi 作为数据湖存储格式,有着高吞吐的写入和低延迟的查询性能,是构建数据湖的常用组件。本文在阿里云EMR上,针对数据实时入湖场景,对 Paimon 和 Hudi 的性能进行比对,并分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。

    65,575
  • 2024-05-15
    448

    跨节点参数的缘起与今生

    Dataphin v3.13引入了跨节点参数功能,允许任务间传递消息。输出节点(如SQL、Shell、Python任务)能输出参数,输入节点可以接收并使用这些参数。此功能解决了通过公共存储中转消息的复杂性和低效问题。应用场景包括:金融企业的币种转换,其中汇率任务(输出节点)提供汇率,转换任务(输入节点)使用该汇率;以及产品目录更新检查,通过跨节点参数控制是否需要执行数据导入任务。用户可以通过任务编辑器设置和传递跨节点参数,并在运维中进行补数据操作。

    448
  • 2023-02-21
    1274

    如何在Anolis OS上轻松使用 Kata 安全容器

    本篇文章我们将详细介绍怎么轻松在 Anolis OS 上使用 Kata Containers 安全容器

    1,274
  • 2023-03-09
    11739

    数据湖存储的安全写入之道

    本文以 Hadoop 社区中的 S3A Connector 的实现为切入,分析了数据湖写入路径的安全性。

    11,739
  • 2023-08-03
    13298

    搭建Hadoop环境

    本教程介绍如何在Linux操作系统的ECS实例上快速搭建Hadoop伪分布式环境。

  • 2023-08-31
    1534

    便捷、快速、稳定、高性能,以 GPU 实例演示 Alibaba Cloud Linux 3 对 AI 生态的支持龙蜥技术

    在多维度的优化加持下,Alibaba Cloud Linux 3 解决了 AI 开发人员的痛点问题,让 AI 开发体验更容易更高效。

    1,534
  • 2023-12-01
    80162

    AI 时代的 GPU 生存工具包,每个开发人员必须知道的最低限度

    AI技术迎来了“百花齐放”的春天,这既是我们的挑战也是机会。而AI+千行百业创造了无限可能,也为独立开发者提供了大量的资源、支持以及学习经验的机会。本文分享一篇摘录自Hexmos 期刊的AI 时代的 GPU 生存工具包。

  • 2023-12-01
    871

    MaxCompute 重装上阵,Global Zorder

    MaxCompute支持Global Zorder,使得整个表或者分区的数据在全局上能按照指定字段进行ZORDER排序,以便数据能有更好的聚集性。

    871
  • 2024-05-15
    411

    百亿大规模图在广告场景的应用

    这篇摘要主要介绍了美团外卖在搜索推荐业务中如何利用图技术解决挑战,包括外卖广告搜索推荐业务的介绍、异构大图的演进、大规模图引擎的建设,以及系统的总结和展望。

  • 1
    ...
    5
    6
    7
    ...
    11
    到第
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    6/11