官方博客-第41页-阿里云开发者社区

阿里云云原生

2024-11-01

915

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

915

阿里云云原生

2025-01-06

279

函数计算助您 7 分钟极速部署开源对话大模型

本方案利用函数计算的无服务器架构，您可以在函数计算控制台选择魔搭（ModelScope）开源大模型应用模板；同时，我们将利用文件存储 NAS ，为应用服务所需的大模型和相关文件提供一个安全的存储环境；最终通过访问提供的域名进行模型的调用与验证。仅需三步，即可玩转目前热门 AI 大模型。

阿里云云原生

279

澄潭计缘望宸

2025-03-14

896

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

896

夏振华许文豪

2025-04-18

485

AI 时代，为什么编程能力≠ 开发门槛

在 2.0 阶段，我们目标是实现面向任务的协同编码模式，人的主要职责转变为任务的下发、干预以及最后结果的审查。在这个过程中，人的实际工作量开始减轻，AI 工作的占比显著提升。目前的 2.0 版本是我们最近上线的。

夏振华许文豪

485

豁朗

2022-05-16

2169

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

本文提供一种相对Sidecar部署更轻量级的采集方式，只需要部署少量的Logtail容器，即可采集不同业务容器的日志。

豁朗

2,169

寒斜

2022-10-14

515

人人都是Serverless架构师之传统内容管理系统改造实战三[性能优化]

内容管理系统是很常见的一种web应用场景，可以用到个人独立站，企业官网展示等场景，具有很高的实用价值，一个标准的内容管理系统主要由三个部分组成主站展示部分、后台管理系统、API接口服务，本系列文章会以一个已有内容管理系统的Serverless架构重构展开，介绍改造的基本思路，改造细节，以及性能优化业务可观测设计等。涉及大家关心的Serverless生产遇到的一些问题，比如数据库、日志、动静态分离、调试、维护、灰度方案等。最真实的展现Serverless架构的实施落地细节。

寒斜

515

屈岳

2023-12-01

62625

SLS支持高精度时间戳和全局排序

日志内容本身是一种重要信息，日志之间的相对顺序也是因果关系的一种反映，某些场景下如果日志内容完全相同，但是日志间的顺序错乱了反映出来的结果可能和真实世界里面的事件完全相反。

屈岳

62,625

阿里云云原生

2024-05-15

382

从内核的视角观测容器——SysOM 容器监控

阿里云云原生

382

吴昆

2024-05-15

49899

秒级弹性，探索弹性调度与虚拟节点如何迅速响应瞬时算力需求

秒级弹性！探索弹性调度与虚拟节点如何迅速响应瞬时算力需求？

吴昆

49,899

官方博客-第41页-阿里云开发者社区

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

函数计算助您 7 分钟极速部署开源对话大模型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

AI 时代，为什么编程能力≠ 开发门槛

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

人人都是Serverless架构师之传统内容管理系统改造实战三[性能优化]

SLS支持高精度时间戳和全局排序

从内核的视角观测容器——SysOM 容器监控

秒级弹性，探索弹性调度与虚拟节点如何迅速响应瞬时算力需求