官方博客-第16页-阿里云开发者社区

阿里云云原生

2024-05-15

2457

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

本文主要介绍了解析云原生 AI 所遇到的技术挑战和应对方案，随后介绍云原生 AI 领域的关键技术与架构细节，最后分享我们在 ACK 的相关经验及工程实践。

阿里云云原生

2,457

子白

2024-05-15

102428

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,428

李德

2024-12-06

1323

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,323

橙唯

2025-02-21

896

基于LLM打造沉浸式3D世界

阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索，为了解决LLMs与3D结合的问题，近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案，通过自然语言来与引擎内的3D世界进行交互。

橙唯

896

望宸

2025-02-28

1058

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,058

阿里云云原生

2025-04-07

664

极氪汽车云原生架构落地实践

随着极氪数字业务的飞速发展，背后的 IT 技术也在不断更新迭代。极氪极为重视客户对服务的体验，并将系统稳定性、业务功能的迭代效率、问题的快速定位和解决视为构建核心竞争力的基石。

阿里云云原生

664

墨飏

2025-04-17

658

MCP 的 AI 好搭档

本文介绍了MCP（模型上下文协议）及其在AI领域的应用前景。MCP由Anthropic公司推出，通过标准化通信协议实现AI与数据源间的安全隔离，解决了传统AI应用中的数据隐私和安全问题。文章探讨了从LLM到MCP的进化过程，并分析了其面临的挑战，如算力不足和开放性需求。Serverless技术被提出作为解决这些问题的方案，提供弹性算力和支持安全沙箱环境。最后，文章提供了如何一键部署热门MCP Server的教程，帮助开发者快速上手并体验该协议的实际应用效果。

墨飏

658

阿里云开发者

2025-04-24

1137

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,137

阿里云云原生

2025-05-23

547

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

547

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

基于LLM打造沉浸式3D世界

大模型推理主战场：通信协议的标配

极氪汽车云原生架构落地实践

MCP 的 AI 好搭档

为什么一定要做Agent智能体？

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

基于LLM打造沉浸式3D世界

大模型推理主战场：通信协议的标配

极氪汽车云原生架构落地实践

MCP 的 AI 好搭档

为什么一定要做Agent智能体？

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析