矢言

2024-05-15

从0-1的建设云上稳定性

本文将从前后端的视角整体看下我们在云上稳定性治理的一些路径和经验。首先从平台的系统架构模型出发，站在全局视角看下整个平台的风险。

矢言

567

刘军

2024-06-18

16589

Dubbo3 服务原生支持 http 访问，兼具高性能与易用性

本文展示了 Dubbo3 triple 协议是如何简化从协议规范与实现上简化开发测试、入口流量接入成本的，同时提供高性能通信、面向接口的易用性编码。

刘军

16,589

史泽寰

2023-09-19

832

全网最细，深度解析 Istio Ambient Mesh 流量路径

本文旨在对 Istio Ambient Mesh 的流量路径进行详细解读，力求尽可能清晰地呈现细节，以帮助读者完全理解 Istio Ambient Mesh 中最为关键的部分。

史泽寰

832

赫曦

2024-05-15

92610

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

92,610

ModelScope

2024-05-15

407

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

407

林以琳

2024-05-15

772

基于PAI-DSW快速启动Stable Diffusion WebUI

基于PAI-DSW快速启动Stable Diffusion WebUI，创作你的专属冬日主题AI画作！

林以琳

772

阿里云大数据Al技术

2024-05-15

77694

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

77,694

澄潭董艺荃

2024-05-16

87958

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

87,958

龙蜥社区OpenAnolis

2024-07-05

117

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐

ZOLOZ，视觉 AI 推理的算力和成本问题求解。

龙蜥社区OpenAnolis

117

类目筛选

内容类型

从0-1的建设云上稳定性

Dubbo3 服务原生支持 http 访问，兼具高性能与易用性

全网最细，深度解析 Istio Ambient Mesh 流量路径

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

vLLM部署Yuan2.0：高吞吐、更便捷

基于PAI-DSW快速启动Stable Diffusion WebUI

【AAAI 2024】MuLTI：高效视频与语言理解

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐