官方博客-第18页-阿里云开发者社区

ModelScope

2024-05-15

744

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

744

阿里云实时数仓Hologres

2024-06-27

2982

实时数仓Hologres OLAP场景核心能力介绍

Hologres提供统一、实时、弹性、易用的一站式实时数仓引擎，解决复杂OLAP难题。

阿里云实时数仓Hologres

2,982

灵杰开发者

2024-08-22

18004

Apache Paimon V0.9最新进展

Apache Paimon V0.9 版本即将发布，此版本带来了多项新特性并解决了关键挑战。Paimon自2022年从Flink社区诞生以来迅速成长，已成为Apache顶级项目，并广泛应用于阿里集团内外的多家企业。

灵杰开发者

18,004

剑洁雲尧

2024-09-04

631

浅谈Elasticsearch的入门与实践

本文主要围绕ES核心特性：分布式存储特性和分析检索能力，介绍了概念、原理与实践案例，希望让读者快速理解ES的核心特性与应用场景。

剑洁雲尧

631

缘祺

2024-10-21

871

本文基于MySQL 8.0.34版本的源代码，详细介绍了MySQL中统计信息的计算和更新机制。文章首先概述了`records_per_key`统计信息在代价估计和Join Reorder算法中的重要性，接着了InnoDB统计信息的存储和计算方法，包括表级和索引级的统计信息。文章还介绍了统计信息的采样算法，特别是重要性采样在减少估计方差中的应用。此外，文章讨论了统计信息的更新时机，包括手动更新和自动更新。最后，文章简要介绍了直方图和其它统计信息，如表在内存中的占比估计，并通过实例展示了如何使用optimizer trace来分析查询优化过程。希望本文能帮助读者更好地理解MySQL的优化器。

缘祺

871

李泽政

2024-11-01

816

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

本文中，阿里云智能集团开发工程师李泽政以 Alinux 为操作环境，讲解模块相比传统头文件有哪些优势，并通过若干个例子，学习如何组织一个 C++ 模块工程并使用模块封装第三方库或是改造现有的项目。

李泽政

816

明巍临城水德

2024-11-14

538

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

538

沈炼

2024-12-13

1563

从大数据到大模型：如何做到“心无桎梏，身无藩篱”

在大数据和大模型的加持下，现代数据技术释放了巨大的技术红利，通过多种数据范式解除了数据的桎梏，使得应用程序达到了“心无桎梏，身无藩篱”的自在境界，那么现代应用有哪些数据范式呢？这正是本文尝试回答的问题。

沈炼

1,563

殳玄

2025-01-16

1027

现身说法，AI小白的大模型学习路径

写这篇文章的初衷：作为一个AI小白，把我自己学习大模型的学习路径还原出来，包括理解的逻辑、看到的比较好的学习材料，通过一篇文章给串起来，对大模型建立起一个相对体系化的认知，才能够在扑面而来的大模型时代，看出点门道。

殳玄

1,027

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

联合XTuner，魔搭社区全面支持数据集的长文本训练

实时数仓Hologres OLAP场景核心能力介绍

Apache Paimon V0.9最新进展

浅谈Elasticsearch的入门与实践

浅析MySQL优化器统计信息

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

从大数据到大模型：如何做到“心无桎梏，身无藩篱”

现身说法，AI小白的大模型学习路径

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

联合XTuner，魔搭社区全面支持数据集的长文本训练

实时数仓Hologres OLAP场景核心能力介绍

Apache Paimon V0.9最新进展

浅谈Elasticsearch的入门与实践

浅析MySQL优化器统计信息

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

从大数据到大模型：如何做到“心无桎梏，身无藩篱”

现身说法，AI小白的大模型学习路径

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理