官方博客-第13页-阿里云开发者社区

德灵

2024-05-15

118042

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,042

ModelScope

2024-05-15

2572

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,572

望宸

2025-02-28

1057

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,057

豁朗

2022-05-16

2212

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

本文提供一种相对Sidecar部署更轻量级的采集方式，只需要部署少量的Logtail容器，即可采集不同业务容器的日志。

豁朗

2,212

赫曦

2024-05-15

93168

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,168

ModelScope

2024-05-15

104681

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用，用于方便地创建针对各种现实应用量身定制智能体，目前已经在生产级别落地。

ModelScope

104,681

寒斜

2024-11-19

738

基于事件驱动构建 AI 原生应用

AI 应用在商业化服务的阶段会面临诸多挑战，比如更快的服务交付速度，更实时、精准的结果以及更人性化的体验等，传统架构限制于同步交互，无法满足上述需求，本篇文章给大家分享一下如何基于事件驱动架构应对上述挑战。

寒斜

738

涯海

2025-01-23

947

快速定位并优化CPU 与 JVM 内存性能瓶颈

本文介绍了 Java 应用常见的 CPU & JVM 内存热点原因及优化思路。

涯海

947

橙唯

2025-02-21

894

基于LLM打造沉浸式3D世界

阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索，为了解决LLMs与3D结合的问题，近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案，通过自然语言来与引擎内的3D世界进行交互。

橙唯

894

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

阿里云PAI大模型RAG对话系统最佳实践

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

大模型推理主战场：通信协议的标配

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

手把手教你捏一个自己的Agent

基于事件驱动构建 AI 原生应用

快速定位并优化CPU 与 JVM 内存性能瓶颈

基于LLM打造沉浸式3D世界

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

阿里云PAI大模型RAG对话系统最佳实践

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

大模型推理主战场：通信协议的标配

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

手把手教你捏一个自己的Agent

基于事件驱动构建 AI 原生应用

快速定位并优化CPU 与 JVM 内存性能瓶颈

基于LLM打造沉浸式3D世界