ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

364

阿里云云原生

2024-05-15

66748

无需重新学习，使用 Kibana 查询/可视化 SLS 数据

本文演示了使用 Kibana 连接 SLS ES 兼容接口进行查询和分析的方法。

阿里云云原生

66,748

查斌

2023-04-14

349

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

Nydus+Dragonfly 组合减少容器启动过程中镜像的拉取时间，提升集群间的镜像分发效率。

查斌

349

ModelScope

2024-05-15

323

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

323

阿里云云原生

2024-05-16

56180

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

56,180

云服务器ECS

2023-07-10

4150

一键配置版：搭建高可用的微信/支付宝小程序服务

本文提供在阿里云云服务器ECS上基于CentOS 7.9 64位操作系统搭建高可用的小程序服务端的指引。同时指导您在本地开发一个简单的微信/支付宝小程序——ECS小助手，通过远程调用部署在ECS上的服务端，实现在小程序中输入框输入ECS实例ID查询实例详细信息的功能。

云服务器ECS

4,150

涯客十眠

2023-08-04

775

Sentinel 2.0 微服务零信任的探索与实践

涯客十眠

775

林以琳

2024-05-15

747

基于PAI-DSW快速启动Stable Diffusion WebUI

基于PAI-DSW快速启动Stable Diffusion WebUI，创作你的专属冬日主题AI画作！

林以琳

747

隆基

2024-05-15

78709

深度剖析 RocketMQ 5.0，流数据库：如何实现一体化流处理？

本文将从概念和宏观角度理解什么是流处理。 RocketMQ 5.0，学习 RocketMQ 提供的轻量流处理引擎 RStreams，了解其特性和原理。学习 RocketMQ 的流数据库 RSQLDB，通过流存储和流计算的深度结合，看它如何进一步降低流处理使用门槛。

隆基

78,709

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

无需重新学习，使用 Kibana 查询/可视化 SLS 数据

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

一键配置版：搭建高可用的微信/支付宝小程序服务

Sentinel 2.0 微服务零信任的探索与实践

基于PAI-DSW快速启动Stable Diffusion WebUI

深度剖析 RocketMQ 5.0，流数据库：如何实现一体化流处理？