官方博客-第12页-阿里云开发者社区

ModelScope

2024-05-15

1163

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,163

雨鸦

2024-12-27

1565

极简开发，极速上线：构建端到端大模型应用

本文将以一个经典的 RAG（检索增强生成）知识问答系统为例，详细介绍从智能体设计到最终应用部署的全流程。

雨鸦

1,565

ModelScope

2024-05-15

2600

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,600

阿里云云原生

2025-01-26

1268

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,268

阿里云云原生

2025-04-28

985

通义灵码Project Rules是一种针对AI代码生成的个性化规则设定工具，旨在解决AI生成代码不精准或不符合开发者需求的问题。通过定义编码规则（如遵循SOLID原则、OWASP安全规范等），用户可引导模型生成更符合项目风格和偏好的代码。例如，在使用阿里云百炼服务平台的curl调用时，通义灵码可根据预设规则生成Java代码，显著提升代码采纳率至95%以上。此外，还支持技术栈、应用逻辑设计、核心代码规范等多方面规则定制，优化生成代码的质量与安全性。

阿里云云原生

985

章磊

2023-08-15

22952

迄今为止最完整的DDD实践

对于一个架构师来说，在软件开发中如何降低系统复杂度是一个永恒的挑战。

章磊

22,952

资源编排ROS

2024-05-15

1720

简单几步，钉钉机器人秒变通义千问对话机器人

大模型不知不觉已经火了快一年了，拥有一个能够随时对话使用的大模型已经成为不少人的刚需。然而，最大的问题可能是如何访问和调用对话模型。如果，我是说如果，能在您的即时通讯软件钉钉中直接与通义千问对话，是不是会让这一切更方便快捷？！按照传统方案，我们要实现上述场景可能需要非常繁琐的接入步骤，甚至还需要自行开发很多代码，这样的准入门槛实在，太！高！啦！而今天，我要向各位隆重介绍一个新的解决方案——阿里云计算巢AppFlow应用与数据集成平台，无需任何代码开发，简单快捷，自动连接企业内部应用与外部应用或数据，搭建企业的自动化服务流程，帮助个人、企业降低了集成实施的周期和成本。

资源编排ROS

1,720

阿里云云原生

2024-05-16

57074

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

57,074

阿里云云原生

2024-05-24

47975

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

使用阿里云函数计算FC，快速部署AI绘画工具ComfyUI，体验高质量图像生成。新用户可享180元试用额度，包括GPU、vCPU、内存和调用次数。开通FC和文件存储NAS，通过应用中心选择ComfyUI模板创建应用。

阿里云云原生

47,975

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

极简开发，极速上线：构建端到端大模型应用

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

最近谈论 SSE 和 WebSocket 的人越来越多的原因

对比测评：AI编程工具需要 Rules 能力

迄今为止最完整的DDD实践

简单几步，钉钉机器人秒变通义千问对话机器人

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

极简开发，极速上线：构建端到端大模型应用

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

最近谈论 SSE 和 WebSocket 的人越来越多的原因

对比测评：AI编程工具需要 Rules 能力

迄今为止最完整的DDD实践

简单几步，钉钉机器人秒变通义千问对话机器人

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图