ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

367

阿里云云原生

2024-05-15

66748

无需重新学习，使用 Kibana 查询/可视化 SLS 数据

本文演示了使用 Kibana 连接 SLS ES 兼容接口进行查询和分析的方法。

阿里云云原生

66,748

阿里云云原生

2024-05-15

78700

让研发规范管得住，在流水线之上做研发流程

研发规范的目标，是为了解决或降低出现软件危机的风险。但传统流水线受限于工具的定位，无法解决研发规范的落地问题，需要在更高的层面来解决。阿里云云效团队经过内部启发后推出的新产品：云效应用交付平台 AppStack 给出了解决方案，快来使用体验吧！

阿里云云原生

78,700

王奇

2023-06-26

8568

Hologres弹性计算在OLAP分析上的实践和探索

本文介绍了OLAP分析在大数据分析中的位置，分析并介绍目前大数据OLAP遇到的分析性能、资源隔离、高可用、弹性扩缩容等核心问题，解析阿里云Hologres是如何解决极致性能、弹性、业务永续、性价比等核心刚需的最佳实践，介绍阿里云Hologres弹性计算组在弹性计算、资源隔离上的探索和创新。

王奇

8,568

里戈

2023-10-26

158089

如何充分发挥 SQL 能力？

如何充分发挥 SQL 能力，是本篇文章的主题。本文尝试独辟蹊径，强调通过灵活的、发散性的数据处理思维，就可以用最基础的语法，解决复杂的数据场景。

里戈

158,089

赵伟基力铭澄潭

2024-02-18

134453

Higress × OpenKruiseGame 游戏网关最佳实践

本文将演示 Higress 如何无缝对接 OKG 游戏服，并为其带来的优秀特性。

赵伟基力铭澄潭等

134,453

ModelScope

2024-05-15

324

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

324

隆基

2024-05-15

78711

深度剖析 RocketMQ 5.0，流数据库：如何实现一体化流处理？

本文将从概念和宏观角度理解什么是流处理。 RocketMQ 5.0，学习 RocketMQ 提供的轻量流处理引擎 RStreams，了解其特性和原理。学习 RocketMQ 的流数据库 RSQLDB，通过流存储和流计算的深度结合，看它如何进一步降低流处理使用门槛。

隆基

78,711

阿里云云原生

2024-05-16

56182

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

56,182

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

无需重新学习，使用 Kibana 查询/可视化 SLS 数据

让研发规范管得住，在流水线之上做研发流程

Hologres弹性计算在OLAP分析上的实践和探索

如何充分发挥 SQL 能力？

Higress × OpenKruiseGame 游戏网关最佳实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

深度剖析 RocketMQ 5.0，流数据库：如何实现一体化流处理？

容器内存可观测性新视角：WorkingSet 与 PageCache 监控