官方博客-第21页-阿里云开发者社区

龙蜥社区OpenAnolis

2024-11-06

776

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

776

阿里云云原生

2024-12-17

867

10 分钟打造你的专属 AI 客服

在这个数字化时代，提供卓越的客户服务已成为企业脱颖而出的关键。为了满足这一需求，越来越多的企业开始探索人工智能（AI）助手的应用，以实现全天候（7x24）的客户咨询响应，全面提升用户体验和业务竞争力。本解决方案通过函数计算FC 和大模型服务平台百炼，为您提供一个高效便捷构建 AI 助手思路。

阿里云云原生

867

望宸

2025-02-20

683

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

683

亦达

2025-02-20

747

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

747

柯灵

2025-03-11

1602

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力，核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理（OOS）一键部署OpenWebUI+Ollama方案，轻松将QwQ-32B模型部署到ECS，或连接阿里云百炼的在线模型。整个过程无需编写代码，全部在控制台完成，适合新手操作。

柯灵

1,602

丕天

2025-03-21

1174

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,174

尹斌斌周絮

2025-03-21

775

解决隐式内存占用难题

本文详细介绍了在云原生和容器化部署环境中，内存管理和性能优化所面临的挑战及相应的解决方案。

尹斌斌周絮

775

阿里云云原生

2025-05-23

583

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

583

秦涛

2023-07-28

1382

MaxCompute ODPS重装上阵， IF ELSE分支语句

MaxCompute通过脚本模式支持IF ELSE分支语句，让程序根据条件自动选择执行逻辑，支持更好的处理因数据不同而需要采用不同策略的业务场景产生的复杂SQL，提高开发者编程的灵活性！

秦涛

1,382

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

10 分钟打造你的专属 AI 客服

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

AI 推理场景的痛点和解决方案

解决隐式内存占用难题

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

MaxCompute ODPS重装上阵， IF ELSE分支语句

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

10 分钟打造你的专属 AI 客服

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

AI 推理场景的痛点和解决方案

解决隐式内存占用难题

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

MaxCompute ODPS重装上阵， IF ELSE分支语句