官方博客-第52页-阿里云开发者社区

ModelScope

2024-05-15

1119

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,119

阿里云云原生

2024-05-15

44082

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

在本文中，作者探讨了ZooKeeper（ZK）的一个内存占用问题，特别是当有大量的Watcher和ZNode时，导致的内存消耗。

阿里云云原生

44,082

澄潭董艺荃

2024-05-16

88515

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

88,515

斜阳

2024-05-16

733

浅谈现代消息队列与云存储

讲述消息系统在现代化演进中软硬一体化，百万队列，分级存储等诸多竞争力特性的诞生和落地效果。探讨业界领先的 Shared-Log 存储计算分离，FFM与协程，RDMA 传输，列式存储等技术，将消息向流的领域延伸。

斜阳

733

阿里云瑶池数据库

2024-07-11

520

OpenAI的选择，实时数仓成为企业AI深度布局赛道

AnalyticDB：数据智能化先驱者

阿里云瑶池数据库

520

颍川

2024-07-18

12347

从自建开源 Prometheus 迁移到阿里云托管 Prometheus 服务

阿里云可观测监控 Prometheus 版提供高性能、高可用、全托管的监控服务，对接开源生态，支持 Kubernetes、ECS 等场景，解决了自建 Prometheus+Thanos 高成本、运维复杂的问题。本文讨论在各个典型场景下的迁移方案。

颍川

12,347

阿里云瑶池数据库

2024-07-18

330

Redis Proxy RT上升后连接倾斜

本文细致地描述了关于Redis Proxy RT上升后连接倾斜问题的排查过程和根本原因，最后给出了优化方案。

阿里云瑶池数据库

330

邢云阳

2024-08-20

19094

AI 网关零代码解决 AI 幻觉问题

本文主要介绍了 AI Agent 的背景，概念，探讨了 AI Agent 网关插件的使用方法，效果以及实现原理。

邢云阳

19,094

硅步

2024-08-23

415

灵魂拷问-前端的作用--chrome插件篇

本文会从浏览器插件应用场景切入，穿插插件基础能力和常见入口的介绍，核心回答如下三个问题：插件可以被使用在哪些场景？不同的使用场景我们的主要代码实现思路是怎样的？我们可以从哪些角度入手自己开发一款可以落地实用的浏览器插件？

硅步

415

官方博客-第52页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

浅谈现代消息队列与云存储

OpenAI的选择，实时数仓成为企业AI深度布局赛道

从自建开源 Prometheus 迁移到阿里云托管 Prometheus 服务

Redis Proxy RT上升后连接倾斜

AI 网关零代码解决 AI 幻觉问题

灵魂拷问-前端的作用--chrome插件篇

官方博客-第52页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

浅谈现代消息队列与云存储

OpenAI的选择，实时数仓成为企业AI深度布局赛道

从自建开源 Prometheus 迁移到阿里云托管 Prometheus 服务

Redis Proxy RT上升后连接倾斜

AI 网关零代码解决 AI 幻觉问题

灵魂拷问-前端的作用--chrome插件篇