ModelScope

2024-05-15

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

194

泮圣伟

2022-07-18

290

Dubbo3 StateRouter下一代高效流量路由机制

目前 MSE 服务治理的离群实例摘除、标签路由、金丝雀发布、全链路灰度等功能已经使用该路由方案，经过我们的压测与演练，在CPU、RT等方面均有不少提升，以 Demo 应用为例 (服务调用的跳数为2，下游30节点，每个节点1c2g) 其中调用 RT 提升约 6.7%。

泮圣伟

290

德歌

2023-09-14

667

沉浸式学习PostgreSQL|PolarDB 14: 共享单车、徒步、旅游、网约车轨迹查询

本文的目的是帮助你了解如何设计轨迹表, 如何高性能的写入、查询、分析轨迹数据.

德歌

667

阿里云云原生

2024-05-15

153444

Higress 基于自定义插件访问 Redis

本文介绍了Higress，一个支持基于WebAssembly (WASM) 的边缘计算网关，它允许用户使用Go、C++或Rust编写插件来扩展其功能。文章特别讨论了如何利用Redis插件实现限流、缓存和会话管理等高级功能。

阿里云云原生

153,444

佳二

2024-05-15

123

奇思妙想的SQL｜兼顾性能的数据倾斜处理新姿势

本篇为系列第2篇，分享在支付宝支付数据链路改造升级过程中，针对数据倾斜的优化实践新方法，在解决数据倾斜问题的同时，还能兼顾更优的计算性能！

佳二

123

ModelScope

2024-05-15

408

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

408

茏久

2023-07-21

137760

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

本文从阿里云用户使用云原生数据仓库AnalyticDB PostgreSQL版（以下简称ADB PG）的实际体验出发，介绍ADB PG如何实现“一站式全文检索”业务，并详细阐述ADB PG使用的优势技术，最后提供对应业务案例分析。

茏久

137,760

尹航

2023-10-09

29856

基于阿里云服务网格流量泳道的全链路流量管理（一）严格模式流量泳道

灰度发布是一种常见的对新版本应用服务的发布手段，其特点在于能够将流量在服务的稳定版本和灰度版本之间时刻切换，以帮助我们用更加可靠的方式实现服务的升级。

尹航

29,856

桦雄

2024-05-15

48214

走进RDS之MySQL内存分配与管理（下）

本篇为下篇，主要对MySQL内存限制特性进行解读，代码基于8.0.28。本文将围绕该项工作的改动、设计实现等方面展开介绍。

桦雄

48,214

类目筛选

内容类型

联合XTuner，魔搭社区全面支持数据集的长文本训练

Dubbo3 StateRouter下一代高效流量路由机制

沉浸式学习PostgreSQL|PolarDB 14: 共享单车、徒步、旅游、网约车轨迹查询

Higress 基于自定义插件访问 Redis

奇思妙想的SQL｜兼顾性能的数据倾斜处理新姿势

vLLM部署Yuan2.0：高吞吐、更便捷

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

基于阿里云服务网格流量泳道的全链路流量管理（一）严格模式流量泳道

走进RDS之MySQL内存分配与管理（下）