矢言

2024-05-15

从0-1的建设云上稳定性

本文将从前后端的视角整体看下我们在云上稳定性治理的一些路径和经验。首先从平台的系统架构模型出发，站在全局视角看下整个平台的风险。

矢言

571

阿里云百炼

2024-07-09

556

阿里云百炼应用实践系列-基于LlamaIndex的文档问答助手

本文以百炼官方文档问答助手为例，介绍如何基于百炼平台打造基于LlamaIndex的RAG文档问答产品。我们基于百炼平台的底座能力，以官方帮助文档为指定知识库，搭建了问答服务，支持钉钉、Web访问。介绍了相关技术方案和主要代码，供开发者参考。

阿里云百炼

556

ModelScope

2024-05-15

411

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

411

阿里云大数据Al技术

2024-07-31

7057

OSS数据源一站式RAG最佳实践

本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。

阿里云大数据Al技术

7,057

偏左

2023-08-28

20806

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

当代AI来势汹汹，本文从AI的特点、对研发的挑战、AI的应用工程和场景分化等剖析了AI时代的应用工程化架构演进之路。

偏左

20,806

CloudImagine

2024-05-15

123

AIGC下一步：用AI再度重构或优化媒体处理

LiveVideoStackCon2023深圳站，阿里云视频云演讲分享

CloudImagine

123

ModelScope

2024-05-15

428

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

428

ModelScope

2024-05-15

353

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

353

阿里云云原生

2024-05-15

73

实践总结｜前端架构设计的一点考究（中）

本文总结了作者在日常/大促业务的“敏捷”开发过程中产生的疑惑，并尝试做出思考得到一些解决思路和方案。在前端开发和实践过程中，梳理了一些简单设计方案可以缓解当时 “头疼” 的几个敏捷迭代问题，并实践在项目迭代中。

阿里云云原生

73

类目筛选

内容类型

从0-1的建设云上稳定性

阿里云百炼应用实践系列-基于LlamaIndex的文档问答助手

vLLM部署Yuan2.0：高吞吐、更便捷

OSS数据源一站式RAG最佳实践

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

AIGC下一步：用AI再度重构或优化媒体处理

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

实践总结｜前端架构设计的一点考究（中）