ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

405

茏久

2023-07-21

137759

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

本文从阿里云用户使用云原生数据仓库AnalyticDB PostgreSQL版（以下简称ADB PG）的实际体验出发，介绍ADB PG如何实现“一站式全文检索”业务，并详细阐述ADB PG使用的优势技术，最后提供对应业务案例分析。

茏久

137,759

安正

2023-08-31

1114

便捷、快速、稳定、高性能，以 GPU 实例演示 Alibaba Cloud Linux 3 对 AI 生态的支持龙蜥技术

在多维度的优化加持下，Alibaba Cloud Linux 3 解决了 AI 开发人员的痛点问题，让 AI 开发体验更容易更高效。

安正

1,114

ModelScope

2024-05-15

108906

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

108,906

李鹏

2024-05-15

207

Serverless Kubernetes 开发实践：异构资源，按需使用

Kubernetes 作为当今云原生业界标准，具备良好的生态以及跨云厂商能力。Kubernetes 很好的抽象了 IaaS 资源交付标准，使得云资源交付变的越来越简单，与此同时用户期望更多的聚焦于业务自身，做到面向应用交付，Serverless 理念也因此而生。那么如何通过原生 k8s 提供Serverless 能力？如何实现GPU等异构资源按需使用？这里给大家介绍一下我们在Serverless Kubernetes 开发实践：异构资源，按需使用。

李鹏

207

骐迹

2024-05-15

158

企业SaaS应用加速网络场景最佳实践

企业分支通过SAG接入阿里云SDWAN网络，企业本地员工能够通过阿里云SDWAN应用加速线路实现加速访问SaaS服务，目前方案只支持office365、salesforce、ZOOM，后续会考虑加速逐步增加其他三方应用。

骐迹

158

陈浩章颖强

2024-05-29

55221

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,221

太业

2024-06-03

41503

iLogtail 2.0 重大升级，端上支持 SPL

日志数据格式可能是多样且复杂的，iLogtail 插件配置模式已经可以很好的支持复杂数据的处理。iLogtail2.0 又带来了 SPL 语法的重大支持，在日志处理场景下，可以通过多级管道对数据进行交互式、递进式的探索和处理，从配置交互和性能上，都有比较大的提升和优化。iLogtail2.0 已经在逐步灰度中，欢迎大家体验和使用。

太业

41,503

易霏夏花

2024-08-16

7327

PolarDB-X 存储引擎核心技术 | Lizard B+tree 优化

PolarDB-X 分布式数据库，采用集中式和分布式一体化的架构，为了能够灵活应对混合负载业务，作为数据存储的 Data Node 节点采用了多种数据结构，其中使用行存的结构来提供在线事务处理能力，作为 100% 兼容 MySQL 生态的数据库，DN 在 InnoDB 的存储结构基础上，进行了深度优化，大幅提高了数据访问的效率。

易霏夏花

7,327

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

便捷、快速、稳定、高性能，以 GPU 实例演示 Alibaba Cloud Linux 3 对 AI 生态的支持龙蜥技术

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Serverless Kubernetes 开发实践：异构资源，按需使用

企业SaaS应用加速网络场景最佳实践

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

iLogtail 2.0 重大升级，端上支持 SPL

PolarDB-X 存储引擎核心技术 | Lizard B+tree 优化