官方博客-第26页-阿里云开发者社区

阿里云云原生

2024-11-01

921

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

921

明巍临城水德

2024-11-14

476

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

476

阿里云云原生

2024-11-26

554

Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议，弱网效率提升 6 倍

在 Apache Dubbo 3.3.0 版本之后，官方推出了全新升级的 Triple X 协议，全面支持 HTTP/1、HTTP/2 和 HTTP/3 协议。本文将围绕 Triple 协议对 HTTP/3 的支持进行详细阐述，包括其设计目标、实际应用案例、性能测试结果以及源码架构分析等内容。

阿里云云原生

554

探索云世界

2025-01-02

343

云端问道11期实践教学-创建专属AI助手

本次分享意在帮助用户更加全面、深入地了解百炼的核心产品能力，并通过实际操作学会如何快速将大模型与自己的系统及应用相结合。主要包括以下三个方面： 1. 阿里云百炼产品定位和能力简介 2. 知识检索 RAG 智能体应用能力和优势 3. 最佳落地案例实践分享

探索云世界

343

阿里云云原生

2025-01-24

712

智能理解 PPT 内容，快速生成讲解视频

本方案利用函数计算 FC 部署 Web 应用，调用百炼模型服务实现 PPT 到视频的自动转换。视觉模型智能理解 PPT 图文内容，快速生成相匹配的解说词；文本模型对解说词进行优化，提高其可读性和吸引力；语音模型则根据解说词生成生动流畅的旁白音频。整个过程高度集成，只需一键操作，系统即可自动整合图片、文本和音频素材，快速生成对应讲解视频。

阿里云云原生

712

橙唯

2025-02-21

847

基于LLM打造沉浸式3D世界

阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索，为了解决LLMs与3D结合的问题，近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案，通过自然语言来与引擎内的3D世界进行交互。

橙唯

847

阿里云云原生

2025-04-28

650

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

650

阿里云云原生

2025-06-30

368

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

368

喻奎

2023-06-25

10593

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

喻奎

10,593

官方博客-第26页-阿里云开发者社区

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议，弱网效率提升 6 倍

云端问道11期实践教学-创建专属AI助手

智能理解 PPT 内容，快速生成讲解视频

基于LLM打造沉浸式3D世界

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

MaxCompute湖仓一体近实时增量处理技术架构揭秘

官方博客-第26页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议，弱网效率提升 6 倍

云端问道11期实践教学-创建专属AI助手

智能理解 PPT 内容，快速生成讲解视频

基于LLM打造沉浸式3D世界

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

MaxCompute湖仓一体近实时增量处理技术架构揭秘

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理