官方博客-第36页-阿里云开发者社区

ModelScope

2024-05-15

1120

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,120

阿里云云原生

2024-05-15

44083

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

在本文中，作者探讨了ZooKeeper（ZK）的一个内存占用问题，特别是当有大量的Watcher和ZNode时，导致的内存消耗。

阿里云云原生

44,083

阿里云云原生

2024-06-13

56100

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

区别于传统的流水线工具，本实验将带你体验云效应用交付平台 AppStack，从应用视角，完成一个 AI 聊天应用的高效交付。

阿里云云原生

56,100

阿里云云原生

2024-09-02

458

基于 RocketMQ 的云原生 MQTT 消息引擎设计

本文将介绍阿里云如何将 Serverless 架构应用于消息队列，有效降低运营成本，同时利用云原生环境的特性，为 IoT 设备提供快速响应和灵活伸缩的通讯能力。

阿里云云原生

458

牧思

2024-09-03

653

OpenTelemetry Golang Agent 0.1.0-RC 重磅发布

程序语言与编译器团队和阿里云可观测团队开源了遵循 Opentelemetry 规范的 Golang Agent 0.1.0-RC 版本，希望能通过编译期自动插桩的手段实现无侵入式的 Golang 应用观测。

牧思

653

执少

2024-09-06

289

高基数 GroupBy 在 SLS SQL 中的查询加速

本文详细介绍了SLS中的高基数GroupBy查询加速技术。

执少

289

寻剑

2024-09-11

318

表格存储低成本向量检索服务助力 AI 检索

本文阐述了阿里云表格存储（Tablestore）如何通过其向量检索服务应对大规模数据检索的需求，尤其是在成本、规模和召回率这三个关键挑战方面。

寻剑

318

重彦

2024-09-25

677

深入探索 RUM 与全链路追踪：优化数字体验的利器

本文主要介绍了基于 OpenTeletemetry 与 W3C 协议构建端到端全链路的解决方案，同时探讨了 RUM 与端到端链路集成的最佳实践，希望可以为大家在生产环境落地应用提供一些参考。

重彦

677

彦鸿

2024-10-22

414

Python 应用可观测重磅上线：解决 LLM 应用落地的“最后一公里”问题

为增强对 Python 应用，特别是 Python LLM 应用的可观测性，阿里云推出了 Python 探针，旨在解决 LLM 应用落地难、难落地等问题。助力企业落地 LLM。本文将从阿里云 Python 探针的接入步骤、产品能力、兼容性等方面展开介绍。并提供一个简单的 LLM 应用例子，方便测试。

彦鸿

414

官方博客-第36页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

基于 RocketMQ 的云原生 MQTT 消息引擎设计

OpenTelemetry Golang Agent 0.1.0-RC 重磅发布

高基数 GroupBy 在 SLS SQL 中的查询加速

表格存储低成本向量检索服务助力 AI 检索

深入探索 RUM 与全链路追踪：优化数字体验的利器

Python 应用可观测重磅上线：解决 LLM 应用落地的“最后一公里”问题

官方博客-第36页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

基于 RocketMQ 的云原生 MQTT 消息引擎设计

OpenTelemetry Golang Agent 0.1.0-RC 重磅发布

高基数 GroupBy 在 SLS SQL 中的查询加速

表格存储低成本向量检索服务助力 AI 检索

深入探索 RUM 与全链路追踪：优化数字体验的利器

Python 应用可观测重磅上线：解决 LLM 应用落地的“最后一公里”问题