官方博客-第34页-阿里云开发者社区

  • 2023-06-15
    13998

    大数据SQL数据倾斜与数据膨胀的优化与经验总结

    目前市面上大数据查询分析引擎层出不穷,但在业务使用过程中,大多含有性能瓶颈的SQL,主要集中在数据倾斜与数据膨胀问题中。本文结合业界对大数据SQL的使用与优化,尝试给出相对系统性的解决方案。

    13,998
  • 2023-10-12
    1315

    沉浸式学习PostgreSQL|PolarDB 19: 体验最流行的开源企业ERP软件 odoo

    本文主要教大家怎么用好数据库, 而不是怎么运维管理数据库、怎么开发数据库内核.

    1,315
  • 2023-12-01
    859

    MaxCompute 重装上阵,Global Zorder

    MaxCompute支持Global Zorder,使得整个表或者分区的数据在全局上能按照指定字段进行ZORDER排序,以便数据能有更好的聚集性。

    859
  • 2024-05-15
    65565

    阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

    Apache Paimon 和 Apache Hudi 作为数据湖存储格式,有着高吞吐的写入和低延迟的查询性能,是构建数据湖的常用组件。本文在阿里云EMR上,针对数据实时入湖场景,对 Paimon 和 Hudi 的性能进行比对,并分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。

    65,565
  • 2024-05-15
    122588

    每天一个摆脱if-else工程师的技巧,优雅的参数校验

    在日常的开发工作中,为了程序的健壮性,大部分方法都需要进行入参数据校验。本文围绕作者如何优雅的进行参数校验展开讨论。

    122,588
  • 78193

    【AAAI 2024】MuLTI:高效视频与语言理解

    多模态理解模型具有广泛的应用,比如多标签分类、视频问答(videoQA)和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展,然而,他们仍然面临两个巨大的挑战:无法充分的利用现有的特征;训练时巨大的GPU内存消耗。我们提出了MuLTI,这是一种高度准确高效的视频和语言理解模型,可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

  • 2024-05-15
    1348

    AIGC训练场景下的存储特征研究

    在今天这样以AIGC为代表的AI时代下,了解训练场景对于存储的具体诉求同样是至关重要的。本文将尝试解读WEKA的一个相关报告,来看看AIGC对于存储有哪些具体的性能要求。

  • 2024-05-15
    105318

    深度|庖丁解InnoDB之Buffer Pool

    聚焦在Buffer Pool的本职功能上,从其提供的接口、内存组织方式、Page获取、刷脏等方面进行介绍

    105,318
  • Flink+Paimon+Hologres 构建实时湖仓数据分析

    本文整理自阿里云高级专家喻良,在 Flink Forward Asia 2023 主会场的分享。

  • 1
    ...
    33
    34
    35
    ...
    71
    到第