ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

406

阿里云云原生

2024-05-15

57118

低成本、高稳定性 | 满帮集团 Eureka 和 ZooKeeper 的上云实践

业务体量增大后，日益凸显的架构稳定性问题该如何解决？满帮集团选择了上阿里云，采用阿里云 MSE Nacos，MSE ZooKeeper 产品替换原先的 Eureka 和 Zookeeper 集群，做到了低成本快速的架构升级，以及上云期间业务流量的无损平滑迁移。

阿里云云原生

57,118

澄潭董艺荃

2024-05-16

87958

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

87,958

龙蜥社区OpenAnolis

2024-07-05

117

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐

ZOLOZ，视觉 AI 推理的算力和成本问题求解。

龙蜥社区OpenAnolis

117

澄潭望宸

2024-07-22

371

AI 时代，网关更能打了

随着互联网从 Web 2.0 迈进到 AI 时代，用户和互联网的交互方式，AI 时代下互联网的内容生产流程都发生了显著的转变，这对基础设施（Infra）提出了新的诉求，也带来了新的机遇。Infra 包含的内容非常丰富，本文仅从网关层面分享笔者的所见所感所悟。

澄潭望宸

371

豁朗

2022-05-16

1823

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

本文提供一种相对Sidecar部署更轻量级的采集方式，只需要部署少量的Logtail容器，即可采集不同业务容器的日志。

豁朗

1,823

王奇

2023-06-26

8594

Hologres弹性计算在OLAP分析上的实践和探索

本文介绍了OLAP分析在大数据分析中的位置，分析并介绍目前大数据OLAP遇到的分析性能、资源隔离、高可用、弹性扩缩容等核心问题，解析阿里云Hologres是如何解决极致性能、弹性、业务永续、性价比等核心刚需的最佳实践，介绍阿里云Hologres弹性计算组在弹性计算、资源隔离上的探索和创新。

王奇

8,594

兆维

2023-08-31

436

为什么 Higress 是 Knative 入口网关的最佳实践

Knative Serving 是一款基于 K8s 的 Serverless 开源平台，用于构建和管理现代化、可拓展、流量驱动、无服务器的应用程序。本文重点关注 Knative 网络层能力的实现。

兆维

436

古琦

2024-05-15

109753

应用监控 eBPF 版：实现 Golang 微服务的无侵入应用监控

古琦

109,753

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

低成本、高稳定性 | 满帮集团 Eureka 和 ZooKeeper 的上云实践

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐

AI 时代，网关更能打了

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

Hologres弹性计算在OLAP分析上的实践和探索

为什么 Higress 是 Knative 入口网关的最佳实践

应用监控 eBPF 版：实现 Golang 微服务的无侵入应用监控