官方博客-第16页-阿里云开发者社区

阿里云云原生

2024-05-15

2457

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

本文主要介绍了解析云原生 AI 所遇到的技术挑战和应对方案，随后介绍云原生 AI 领域的关键技术与架构细节，最后分享我们在 ACK 的相关经验及工程实践。

阿里云云原生

2,457

子白

2024-05-15

102428

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,428

资源编排ROS

2024-05-15

1691

简单几步，钉钉机器人秒变通义千问对话机器人

大模型不知不觉已经火了快一年了，拥有一个能够随时对话使用的大模型已经成为不少人的刚需。然而，最大的问题可能是如何访问和调用对话模型。如果，我是说如果，能在您的即时通讯软件钉钉中直接与通义千问对话，是不是会让这一切更方便快捷？！按照传统方案，我们要实现上述场景可能需要非常繁琐的接入步骤，甚至还需要自行开发很多代码，这样的准入门槛实在，太！高！啦！而今天，我要向各位隆重介绍一个新的解决方案——阿里云计算巢AppFlow应用与数据集成平台，无需任何代码开发，简单快捷，自动连接企业内部应用与外部应用或数据，搭建企业的自动化服务流程，帮助个人、企业降低了集成实施的周期和成本。

资源编排ROS

1,691

李德

2024-12-06

1323

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,323

楠瑆

2024-12-09

524

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK

阿里云 ARMS 用户体验监控（RUM）推出了针对原生鸿蒙应用的 SDK。SDK 使用 ArkTS 语言开发，支持页面采集、资源加载采集、异常采集及自定义采集等功能，能够全面监控鸿蒙应用的表现。集成简单，只需几步即可将 SDK 接入项目中，为鸿蒙应用的开发者提供了强有力的支持。

楠瑆

524

橙唯

2025-02-21

896

基于LLM打造沉浸式3D世界

阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索，为了解决LLMs与3D结合的问题，近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案，通过自然语言来与引擎内的3D世界进行交互。

橙唯

896

望宸

2025-02-28

1058

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,058

墨飏

2025-04-17

658

MCP 的 AI 好搭档

本文介绍了MCP（模型上下文协议）及其在AI领域的应用前景。MCP由Anthropic公司推出，通过标准化通信协议实现AI与数据源间的安全隔离，解决了传统AI应用中的数据隐私和安全问题。文章探讨了从LLM到MCP的进化过程，并分析了其面临的挑战，如算力不足和开放性需求。Serverless技术被提出作为解决这些问题的方案，提供弹性算力和支持安全沙箱环境。最后，文章提供了如何一键部署热门MCP Server的教程，帮助开发者快速上手并体验该协议的实际应用效果。

墨飏

658

阿里云开发者

2025-04-24

1137

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,137

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

简单几步，钉钉机器人秒变通义千问对话机器人

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK

基于LLM打造沉浸式3D世界

大模型推理主战场：通信协议的标配

MCP 的 AI 好搭档

为什么一定要做Agent智能体？

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

简单几步，钉钉机器人秒变通义千问对话机器人

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK

基于LLM打造沉浸式3D世界

大模型推理主战场：通信协议的标配

MCP 的 AI 好搭档

为什么一定要做Agent智能体？