邢云阳

2024-08-20

AI 网关零代码解决 AI 幻觉问题

本文主要介绍了 AI Agent 的背景，概念，探讨了 AI Agent 网关插件的使用方法，效果以及实现原理。

邢云阳

18,694

阿里云云原生

2024-08-22

19262

一线实战：运维人少，我们从 0 到 1 实践 DevOps 和云原生

上海经证科技有限公司为有效推进软件项目管理和开发工作，选择了阿里云云效作为 DevOps 解决方案。通过云效，实现了从 0 开始，到现在近百个微服务、数百条流水线与应用交付的全面覆盖，有效支撑了敏捷开发流程。

阿里云云原生

19,262

子白

2024-05-15

101270

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,270

千习

2024-07-22

14609

Spring Cloud Alibaba 集成分布式定时任务调度功能

Spring Cloud Alibaba 发布了 Scheduling 任务调度模块 [#3732]提供了一套开源、轻量级、高可用的定时任务解决方案，帮助您快速开发微服务体系下的分布式定时任务。

千习

14,609

孟威

2024-05-15

104309

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

104,309

赵世振

2024-07-30

493

阿里云百炼应用实践系列-AI助手快速搭建

本文主要介绍如何基于百炼平台快速在10分钟为您的网站添加一个 AI 助手。我们基于百炼平台的能力，以官方帮助文档为参考，搭建了一个以便全天候（7x24）回应客户咨询的AI助手，介绍了相关技术方案和主要代码，供开发者参考。

赵世振

493

赵世振

2024-08-21

246

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

通过使用“百炼”平台，您可以快速构建一个多代理（Multi-Agent）架构的智能导购助手。该助手能够通过多轮互动了解顾客的具体需求，收集详细信息后，利用“百炼”的知识检索增强功能或已有的商品数据库进行商品搜索，为顾客推荐最合适的产品。

赵世振

246

计缘

2024-09-02

128

基于阿里云函数计算（FC）x 云原生 API 网关构建生产级别 LLM Chat 应用方案最佳实践

本文带大家了解一下如何使用阿里云Serverless计算产品函数计算构建生产级别的LLM Chat应用。该最佳实践会指导大家基于开源WebChat组件LobeChat和阿里云函数计算（FC）构建企业生产级别LLM Chat应用。实现同一个WebChat中既可以支持自定义的Agent，也支持基于Ollama部署的开源模型场景。

计缘

128

ModelScope

2024-05-15

2158

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

2,158

类目筛选

内容类型

AI 网关零代码解决 AI 幻觉问题

一线实战：运维人少，我们从 0 到 1 实践 DevOps 和云原生

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Spring Cloud Alibaba 集成分布式定时任务调度功能

SLS 大模型可观测&安全推理审计标准解决方案

阿里云百炼应用实践系列-AI助手快速搭建

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

基于阿里云函数计算（FC）x 云原生 API 网关构建生产级别 LLM Chat 应用方案最佳实践

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦