官方博客-第14页-阿里云开发者社区

丕天

2025-03-21

1296

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,296

吴昆

2024-05-15

222169

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,169

ModelScope

2024-05-15

893

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

893

垚佳汐遥

2024-10-23

1092

通义灵码知识库问答增强：知识库构建与管理指南

通义灵码能够结合企业知识库的私域数据，生成贴合企业特点的回答。充分发挥检索增强技术的优势，构建高质量的企业知识数据以及合理的知识库权限管理是必不可少的。本文将为您详细介绍如何构造与管理一个高质量的企业知识库。

垚佳汐遥

1,092

星莲

2024-11-21

1574

剖析大模型连“Strawberry”的“r”都数不对的原因

本文将从两个常见的大模型翻车问题入手解析这些问题背后体现的大模型技术原理，并解释了为什么会导致这些问题，接着我们利用CoT（思维链）方法解决这些问题并基于上述原理试图剖析CoT方法起作用的可能原因，最后提出【理由先行】风格这一简单有效的Prompt Trick。

星莲

1,574

雨鸦

2024-12-27

1734

极简开发，极速上线：构建端到端大模型应用

本文将以一个经典的 RAG（检索增强生成）知识问答系统为例，详细介绍从智能体设计到最终应用部署的全流程。

雨鸦

1,734

探索云世界

2025-01-02

487

云端问道11期实践教学-创建专属AI助手

本次分享意在帮助用户更加全面、深入地了解百炼的核心产品能力，并通过实际操作学会如何快速将大模型与自己的系统及应用相结合。主要包括以下三个方面： 1. 阿里云百炼产品定位和能力简介 2. 知识检索 RAG 智能体应用能力和优势 3. 最佳落地案例实践分享

探索云世界

487

望宸

2025-02-28

1285

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,285

孙玉梅

2025-04-01

541

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

探讨了 SLS 中增强数据安全的几种方式：权限精细化管控有效减少了潜在安全风险；接入层脱敏技术阻止敏感数据落库，提升了隐私保护；StoreView 字段集控制通过限制查询数据范围，降低数据泄露损害。智能监控系统提供实时监测，快速识别并阻断异常拖库行为，为企业提供了迅速响应和抵御威胁的能力。

孙玉梅

541

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

AI 推理场景的痛点和解决方案

Kube Queue：Kubernetes 任务排队的利器

联合XTuner，魔搭社区全面支持数据集的长文本训练

通义灵码知识库问答增强：知识库构建与管理指南

剖析大模型连“Strawberry”的“r”都数不对的原因

极简开发，极速上线：构建端到端大模型应用

云端问道11期实践教学-创建专属AI助手

大模型推理主战场：通信协议的标配

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI 推理场景的痛点和解决方案

Kube Queue：Kubernetes 任务排队的利器

联合XTuner，魔搭社区全面支持数据集的长文本训练

通义灵码知识库问答增强：知识库构建与管理指南

剖析大模型连“Strawberry”的“r”都数不对的原因

极简开发，极速上线：构建端到端大模型应用

云端问道11期实践教学-创建专属AI助手

大模型推理主战场：通信协议的标配

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防