官方博客-第11页-阿里云开发者社区

亦达

2025-02-20

647

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

647

阿里云开发者

2025-04-24

1049

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,049

阿里云云原生

2025-05-12

902

如何在通义灵码里使用 MCP 能力

通义灵码支持MCP工具使用，通过模型自主规划实现工具调用，深度集成魔搭MCP广场，涵盖2400+热门服务。提供STDIO和SSE两种通信模式，适用于不同场景需求。用户可通过智能体模式调用MCP工具，完成如网页内容抓取、天气查询等任务。文档详细介绍了服务配置、使用流程及常见问题解决方法，助力开发者高效拓展AI编码能力。

阿里云云原生

902

灵杰开发者

2025-08-08

455

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

455

阿里云云原生

2024-05-15

2375

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

本文主要介绍了解析云原生 AI 所遇到的技术挑战和应对方案，随后介绍云原生 AI 领域的关键技术与架构细节，最后分享我们在 ACK 的相关经验及工程实践。

阿里云云原生

2,375

星舰正泽

2024-05-15

67914

通义千问API：让大模型写代码和跑代码

基于前面三章的铺垫，本章我们将展示大模型Agent的强大能力。我们不仅要实现让大模型同时使用多种查询工具，还要实现让大模型能查询天气情况，最后让大模型自己写代码来查询天气情况。

星舰正泽

67,914

寒斜

2024-11-19

659

基于事件驱动构建 AI 原生应用

AI 应用在商业化服务的阶段会面临诸多挑战，比如更快的服务交付速度，更实时、精准的结果以及更人性化的体验等，传统架构限制于同步交互，无法满足上述需求，本篇文章给大家分享一下如何基于事件驱动架构应对上述挑战。

寒斜

659

阿里云开发者

2024-11-29

1011

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阅读这个文章可能的收获：理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

阿里云开发者

1,011

李德

2024-12-06

1250

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,250

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

为什么一定要做Agent智能体？

如何在通义灵码里使用 MCP 能力

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

通义千问API：让大模型写代码和跑代码

基于事件驱动构建 AI 原生应用

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

为什么一定要做Agent智能体？

如何在通义灵码里使用 MCP 能力

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

通义千问API：让大模型写代码和跑代码

基于事件驱动构建 AI 原生应用

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估