ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

405

天凯

2024-05-15

179

【Terraform实现云服务基础设施既代码（IaC）案例实战-2】：通过Terraform实施基础IaC

前言树苗科技公司业务上云2年有余，随着技术的不断发展。运维团队支持业务变更配置、开资源、删资源等过程加班到深夜一两点已是家常便饭。为了进一步提升工作效率，运维总监张三决定对当前业务交付路径进行统一梳理，借助IaC的理念和Terraform自动化工具逐步实施运维生产自动化，改善组内成员频繁加班的现状。...

天凯

179

阿里云大数据Al技术

2024-07-31

7049

OSS数据源一站式RAG最佳实践

本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。

阿里云大数据Al技术

7,049

恶来

2023-05-15

7013

消息队列之 MetaQ 和 Kafka 区别和优势详解

本篇文章介绍MetaQ和Kafka这两个消息队列的区别和优势。

恶来

7,013

茏久

2023-07-21

137759

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

本文从阿里云用户使用云原生数据仓库AnalyticDB PostgreSQL版（以下简称ADB PG）的实际体验出发，介绍ADB PG如何实现“一站式全文检索”业务，并详细阐述ADB PG使用的优势技术，最后提供对应业务案例分析。

茏久

137,759

元乙

2023-11-06

127766

从存储统一到数据融合，SLS在可观测场景的思考和行动

介绍SLS在可观测数据融合分析的一系列技术升级，融合Trace、全栈监控、Continuous Profiling、移动端监控等功能，帮助大家更快速地构筑全栈、自动化的观测能力。

元乙

127,766

ModelScope

2024-05-15

108906

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

108,906

阿里云云原生

2024-05-15

70501

流水线 YAML 高级用法来了，大幅降低重复代码、灵活编排多任务

云效 Flow 流水线 YAML 引入了 template 语法，支持使用模板语言来动态渲染流水线 YAML，满足多个相同或类似逻辑的 Job 批量配置场景，满足多 Job 按需动态生成场景，帮助降低流水线 YAML 重复代码，灵活编排多任务。

阿里云云原生

70,501

陈浩章颖强

2024-05-29

55221

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,221

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

【Terraform实现云服务基础设施既代码（IaC）案例实战-2】：通过Terraform实施基础IaC

OSS数据源一站式RAG最佳实践

消息队列之 MetaQ 和 Kafka 区别和优势详解

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

从存储统一到数据融合，SLS在可观测场景的思考和行动

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

流水线 YAML 高级用法来了，大幅降低重复代码、灵活编排多任务

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移