官方博客-第31页-阿里云开发者社区

泮圣伟吴宇奇木烟

2024-05-15

91415

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

本文介绍了如何通过阿里云 MSE 微服务引擎和云效应用交付平台 AppStack 实现灰度发布。

泮圣伟吴宇奇木烟等

91,415

林清山

2024-05-15

112192

RocketMQ 流数据库解析：实现一体化流处理

RocketMQ 5.0 是一款云原生的消息中间件，旨在覆盖更多业务场景。它针对国内企业在数字化转型中面临的多场景消息处理需求，提供了一体化的解决方案。

林清山

112,192

ModelScope

2024-05-15

1127

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,127

ModelScope

2024-05-15

1107

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,107

斜阳

2024-05-16

740

浅谈现代消息队列与云存储

讲述消息系统在现代化演进中软硬一体化，百万队列，分级存储等诸多竞争力特性的诞生和落地效果。探讨业界领先的 Shared-Log 存储计算分离，FFM与协程，RDMA 传输，列式存储等技术，将消息向流的领域延伸。

斜阳

740

阿里云云原生

2024-05-21

57446

函数计算助力领健信息为“看牙”注入 AI 活力

口腔治疗+函数计算=效率提升🚀 领健作为业界领先的口腔机构，面向口腔诊所提供正畸算法，但早期的算法部署遇到较多问题，因此在对比了阿里云的多个云产品之后，最终选择了函数计算。通过将 GPU 计算负载放到函数计算，领健技术团队达到了很好的降本效果，相比早前的按月持有 GPU 资源，函数计算的费用降低了 90% 左右，并大大提升了使用体验，实现了前所未有的敏捷性和效率。

阿里云云原生

57,446

邢云阳

2024-08-20

19101

AI 网关零代码解决 AI 幻觉问题

本文主要介绍了 AI Agent 的背景，概念，探讨了 AI Agent 网关插件的使用方法，效果以及实现原理。

邢云阳

19,101

喻奎

2024-08-23

284

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

本文主要介绍基于 MaxCompute 的离线近实时一体化新架构如何来支持这些综合的业务场景，提供基于Delta Table的近实时增全量一体的数据存储和计算解决方案。

喻奎

284

重彦

2024-09-25

684

深入探索 RUM 与全链路追踪：优化数字体验的利器

本文主要介绍了基于 OpenTeletemetry 与 W3C 协议构建端到端全链路的解决方案，同时探讨了 RUM 与端到端链路集成的最佳实践，希望可以为大家在生产环境落地应用提供一些参考。

重彦

684

官方博客-第31页-阿里云开发者社区

类目筛选

内容类型

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

RocketMQ 流数据库解析：实现一体化流处理

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

浅谈现代消息队列与云存储

函数计算助力领健信息为“看牙”注入 AI 活力

AI 网关零代码解决 AI 幻觉问题

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

深入探索 RUM 与全链路追踪：优化数字体验的利器

官方博客-第31页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

RocketMQ 流数据库解析：实现一体化流处理

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

浅谈现代消息队列与云存储

函数计算助力领健信息为“看牙”注入 AI 活力

AI 网关零代码解决 AI 幻觉问题

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

深入探索 RUM 与全链路追踪：优化数字体验的利器