官方博客-第17页-阿里云开发者社区

阿里云云原生

2024-11-01

982

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

982

龙蜥社区OpenAnolis

2024-11-06

754

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

754

舟谨

2024-12-13

466

如何提取手写票据信息

本文主要讲述在处理票据信息结构化提取任务时，如何结合OCR（光学字符识别）技术和多模态大模型Qwen-VL来提高票据信息提取的准确性和效率。

舟谨

466

阿里云云原生

2025-01-06

834

人工智能生成图像（AI 生图）的领域中，Stable Diffusion WebUI 以其强大的算法和稳定的输出质量而闻名。它能够快速地从文本描述中生成高质量的图像，为用户提供了一个直观且高效的创作平台。而 ComfyUI 则以其用户友好的界面和高度定制化的选项所受到欢迎。ComfyUI 的灵活性和直观性使得即使是没有技术背景的用户也能轻松上手。本次技术解决方案通过函数计算一键部署热门 AI 生图大模型，凭借其按量付费、卓越弹性、快速交付能力的特点，完美实现低成本，免运维。

阿里云云原生

834

枫桥

2025-02-07

508

从铜线到云端：网络技术的跨越与未来趋势

本文围绕物理网络和云网络基础知识科普进行展开，最后浅谈在AI大模型浪潮下云网络的演进方向。

枫桥

508

言澈

2025-02-28

1185

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,185

柯灵

2025-03-11

1583

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力，核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理（OOS）一键部署OpenWebUI+Ollama方案，轻松将QwQ-32B模型部署到ECS，或连接阿里云百炼的在线模型。整个过程无需编写代码，全部在控制台完成，适合新手操作。

柯灵

1,583

橙鲤

2024-05-15

453

如何在数字世界复刻一个高还原、高拟真的“你”

通过阿里云智能媒体服务IMS完成数字人形象训练、人声克隆定制，并使用Timeline实现视频合成及创作，打造一个“声形俱佳”的数字分身。

橙鲤

453

才胜南也

2024-09-05

983

RAG效果优化：高质量文档解析详解

本文关于如何将非结构化数据（如PDF和Word文档）转换为结构化数据，以便于RAG（Retrieval-Augmented Generation）系统使用。

才胜南也

983

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

如何提取手写票据信息

7分钟玩转 AI 应用，函数计算一键部署 AI 生图大模型

从铜线到云端：网络技术的跨越与未来趋势

进行GPU算力管理

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

如何在数字世界复刻一个高还原、高拟真的“你”

RAG效果优化：高质量文档解析详解

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

如何提取手写票据信息

7分钟玩转 AI 应用，函数计算一键部署 AI 生图大模型

从铜线到云端：网络技术的跨越与未来趋势

进行GPU算力管理

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

如何在数字世界复刻一个高还原、高拟真的“你”

RAG效果优化：高质量文档解析详解