王骜

2024-05-15

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

164,934

葳葳

2024-05-15

122348

每天一个摆脱if-else工程师的技巧，优雅的参数校验

在日常的开发工作中，为了程序的健壮性，大部分方法都需要进行入参数据校验。本文围绕作者如何优雅的进行参数校验展开讨论。

葳葳

122,348

隆基

2024-05-15

90972

深度剖析 RocketMQ 5.0，IoT 消息：物联网需要什么样的消息技术？

本文来学习一个典型的物联网技术架构，以及在这个技术架构里面，消息队列所发挥的作用。在物联网的场景里面，对消息技术的要求和面向服务端应用的消息技术有什么区别？学习 RocketMQ 5.0 的子产品 MQTT，是如何解决这些物联网技术难题的。

隆基

90,972

阿里云大数据Al技术

2024-05-15

77694

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

77,694

隆基

2024-05-15

88513

RocketMQ 流存储解析：面向流场景的关键特性与典型案例

隆基

88,513

阿里云云原生

2024-05-15

153442

Higress 基于自定义插件访问 Redis

本文介绍了Higress，一个支持基于WebAssembly (WASM) 的边缘计算网关，它允许用户使用Go、C++或Rust编写插件来扩展其功能。文章特别讨论了如何利用Redis插件实现限流、缓存和会话管理等高级功能。

阿里云云原生

153,442

ModelScope

2024-05-15

406

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

406

阿里云云原生

2024-05-15

57118

低成本、高稳定性 | 满帮集团 Eureka 和 ZooKeeper 的上云实践

业务体量增大后，日益凸显的架构稳定性问题该如何解决？满帮集团选择了上阿里云，采用阿里云 MSE Nacos，MSE ZooKeeper 产品替换原先的 Eureka 和 Zookeeper 集群，做到了低成本快速的架构升级，以及上云期间业务流量的无损平滑迁移。

阿里云云原生

57,118

澄潭董艺荃

2024-05-16

87958

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

87,958

类目筛选

内容类型

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

每天一个摆脱if-else工程师的技巧，优雅的参数校验

深度剖析 RocketMQ 5.0，IoT 消息：物联网需要什么样的消息技术？

【AAAI 2024】MuLTI：高效视频与语言理解

RocketMQ 流存储解析：面向流场景的关键特性与典型案例

Higress 基于自定义插件访问 Redis

vLLM部署Yuan2.0：高吞吐、更便捷

低成本、高稳定性 | 满帮集团 Eureka 和 ZooKeeper 的上云实践

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚