ModelScope

2024-05-15

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

354

澄潭董艺荃

2024-05-16

87962

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

87,962

阿里云实时数仓Hologres

2022-12-06

1233

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效。

阿里云实时数仓Hologres

1,233

CloudImagine

2024-05-15

123

AIGC下一步：用AI再度重构或优化媒体处理

LiveVideoStackCon2023深圳站，阿里云视频云演讲分享

CloudImagine

123

王骜

2024-05-15

164939

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

164,939

阿里云存储

2024-05-15

978

AIGC训练场景下的存储特征研究

在今天这样以AIGC为代表的AI时代下，了解训练场景对于存储的具体诉求同样是至关重要的。本文将尝试解读WEKA的一个相关报告，来看看AIGC对于存储有哪些具体的性能要求。

阿里云存储

978

ModelScope

2024-05-15

428

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

428

阿里云云原生

2024-05-15

122

实践总结｜前端架构设计的一点考究（下）

作者将【DDD、六边形、洋葱、清洁、CQRS】进行深入学习并梳理总结的一个前端架构设计，并且经历一定应用实践的考验。

阿里云云原生

122

ModelScope

2024-05-15

411

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

411

类目筛选

内容类型

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效

AIGC下一步：用AI再度重构或优化媒体处理

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

AIGC训练场景下的存储特征研究

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

实践总结｜前端架构设计的一点考究（下）

vLLM部署Yuan2.0：高吞吐、更便捷