官方博客-第52页-阿里云开发者社区

ModelScope

2024-05-15

1121

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,121

龙蜥社区OpenAnolis

2024-05-15

377

从故障演练到运维工具产品力评测的探索 | 龙蜥技术

随着AI和云原生技术的发展，业界运维工具百花齐放，该如何让优秀的工具脱颖而出？

龙蜥社区OpenAnolis

377

澄潭董艺荃

2024-05-16

88519

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

88,519

斜阳

2024-05-16

735

浅谈现代消息队列与云存储

讲述消息系统在现代化演进中软硬一体化，百万队列，分级存储等诸多竞争力特性的诞生和落地效果。探讨业界领先的 Shared-Log 存储计算分离，FFM与协程，RDMA 传输，列式存储等技术，将消息向流的领域延伸。

斜阳

735

阿里云云原生

2024-05-21

57439

函数计算助力领健信息为“看牙”注入 AI 活力

口腔治疗+函数计算=效率提升🚀 领健作为业界领先的口腔机构，面向口腔诊所提供正畸算法，但早期的算法部署遇到较多问题，因此在对比了阿里云的多个云产品之后，最终选择了函数计算。通过将 GPU 计算负载放到函数计算，领健技术团队达到了很好的降本效果，相比早前的按月持有 GPU 资源，函数计算的费用降低了 90% 左右，并大大提升了使用体验，实现了前所未有的敏捷性和效率。

阿里云云原生

57,439

朱坪刘松伟赵世振

2024-07-01

22630

阿里云 SAE 助力修正商城 3 周内提升系统承载能力 20 倍，轻松应对春晚流量

在 2024 年春节前夕，修正电商事业部面临了前所未有的技术挑战，修正将参与春晚的全民健康好礼派发的活动，且在央视及各大平台进行广告投放，预计流量激增至 16 亿，系统需要承载保底 5 万 QPS，目标 10 万 QPS。修正技术团队迫切需要升级 APP 架构以应对即将到来的超高并发场景。这一挑战不仅是对技术的考验，更是对修正品牌实力的一次展示。为了应对这次巨大的技术挑战，修正技术团队选择与阿里云云原生团队合作，进行 APP 架构的升级。

朱坪刘松伟赵世振等

22,630

龙蜥社区OpenAnolis

2024-07-05

690

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐

ZOLOZ，视觉 AI 推理的算力和成本问题求解。

龙蜥社区OpenAnolis

690

阿里云瑶池数据库

2024-07-18

334

Redis Proxy RT上升后连接倾斜

本文细致地描述了关于Redis Proxy RT上升后连接倾斜问题的排查过程和根本原因，最后给出了优化方案。

阿里云瑶池数据库

334

阿里云云原生

2024-07-29

405

从供应商深度绑定，到走向真正的云原生，他们是这样做的

没有 K8s 的运维权限，开发者也能排查和定位问题。

阿里云云原生

405

官方博客-第52页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

从故障演练到运维工具产品力评测的探索 | 龙蜥技术

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

浅谈现代消息队列与云存储

函数计算助力领健信息为“看牙”注入 AI 活力

阿里云 SAE 助力修正商城 3 周内提升系统承载能力 20 倍，轻松应对春晚流量

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐

Redis Proxy RT上升后连接倾斜

从供应商深度绑定，到走向真正的云原生，他们是这样做的

官方博客-第52页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

从故障演练到运维工具产品力评测的探索 | 龙蜥技术

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

浅谈现代消息队列与云存储

函数计算助力领健信息为“看牙”注入 AI 活力

阿里云 SAE 助力修正商城 3 周内提升系统承载能力 20 倍，轻松应对春晚流量

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐

Redis Proxy RT上升后连接倾斜

从供应商深度绑定，到走向真正的云原生，他们是这样做的