ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

420

山泽

2024-05-15

356

从零构建现代深度学习框架(TinyDL-0.01)

本文主要以一个Java工程师视角，阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架（类比AI的操作系统）。

山泽

356

矢言

2024-05-15

584

从0-1的建设云上稳定性

本文将从前后端的视角整体看下我们在云上稳定性治理的一些路径和经验。首先从平台的系统架构模型出发，站在全局视角看下整个平台的风险。

矢言

584

涯海

2024-06-03

61093

一站式链路追踪：阿里云的端到端解决方案

端到端链路追踪是覆盖全部关联 IT 系统，能够完整记录用户行为在系统间调用路径与状态的最佳实践方案。而真正实现端到端链路追踪，需要解决三个难题：链路插桩、链路采集与加工、链路上下文透传。阿里云 ARMS 目前已支持全链路端到端追踪，快来查看转发吧~

涯海

61,093

阿里云存储

2024-06-26

25655

AutoMQ：基于 Regional ESSD 构建十倍降本的云原生 Kafka

本文介绍了AutoMQ基于Regional ESSD构建的十倍降本云原生，降低成本并提供无限容量，通过将存储层分离，使用ESSD作为WAL，OSS作为主存储，实现了成本降低和性能优化。此外，它利用弹性伸缩和抢占式实例，减少了70%的计算成本，并通过秒级分区迁移实现了高效弹性。而且，AutoMQ与Apache Kafka相比，能实现10倍成本优化和百倍弹性效率提升，且完全兼容Kafka API。

阿里云存储

25,655

赵世振

2024-08-22

226

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

在阿里云平台上，您只需十分钟，无需任何编码，即可在企业微信上为您的组织集成一个具备大模型能力的AI助手。此助手可24小时响应用户咨询，解答各类问题，尤其擅长处理私域问题，从而成为您企业的专属助手，有效提升用户体验及业务竞争力。

赵世振

226

阿里云云原生

2024-09-06

41

MacTalk 测评通义灵码，实现“微信表情”小功能

墨问西东创始人池建强分享了团队使用通义灵码的经验。

阿里云云原生

41

赫曦

2024-05-15

92625

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

92,625

ModelScope

2024-05-15

362

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

362

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

从零构建现代深度学习框架(TinyDL-0.01)

从0-1的建设云上稳定性

一站式链路追踪：阿里云的端到端解决方案

AutoMQ：基于 Regional ESSD 构建十倍降本的云原生 Kafka

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

MacTalk 测评通义灵码，实现“微信表情”小功能

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent