ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

411

阿里云大数据Al技术

2024-07-31

7057

OSS数据源一站式RAG最佳实践

本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。

阿里云大数据Al技术

7,057

偏左

2023-08-28

20806

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

当代AI来势汹汹，本文从AI的特点、对研发的挑战、AI的应用工程和场景分化等剖析了AI时代的应用工程化架构演进之路。

偏左

20,806

ModelScope

2024-05-15

354

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

354

CloudImagine

2024-05-15

123

AIGC下一步：用AI再度重构或优化媒体处理

LiveVideoStackCon2023深圳站，阿里云视频云演讲分享

CloudImagine

123

ModelScope

2024-05-15

428

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

428

阿里云云原生

2024-05-15

73

实践总结｜前端架构设计的一点考究（中）

本文总结了作者在日常/大促业务的“敏捷”开发过程中产生的疑惑，并尝试做出思考得到一些解决思路和方案。在前端开发和实践过程中，梳理了一些简单设计方案可以缓解当时 “头疼” 的几个敏捷迭代问题，并实践在项目迭代中。

阿里云云原生

73

澄潭董艺荃

2024-05-16

87961

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

87,961

阿里云云原生

2024-05-24

47336

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

使用阿里云函数计算FC，快速部署AI绘画工具ComfyUI，体验高质量图像生成。新用户可享180元试用额度，包括GPU、vCPU、内存和调用次数。开通FC和文件存储NAS，通过应用中心选择ComfyUI模板创建应用。

阿里云云原生

47,336

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

OSS数据源一站式RAG最佳实践

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

AIGC下一步：用AI再度重构或优化媒体处理

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

实践总结｜前端架构设计的一点考究（中）

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图