官方博客-第16页-阿里云开发者社区

阿里云云原生

2025-01-24

820

智能理解 PPT 内容，快速生成讲解视频

本方案利用函数计算 FC 部署 Web 应用，调用百炼模型服务实现 PPT 到视频的自动转换。视觉模型智能理解 PPT 图文内容，快速生成相匹配的解说词；文本模型对解说词进行优化，提高其可读性和吸引力；语音模型则根据解说词生成生动流畅的旁白音频。整个过程高度集成，只需一键操作，系统即可自动整合图片、文本和音频素材，快速生成对应讲解视频。

阿里云云原生

820

望宸

2025-02-20

679

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

679

阿里云开发者

2025-04-24

200

快速定位进程性能瓶颈

这篇文章详细介绍了进程热点追踪的概念、业务痛点、解决方案以及实际案例分析，旨在帮助开发者和运维人员快速定位和解决系统性能瓶颈问题。

阿里云开发者

200

ModelScope

2024-05-15

1474

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

零一万物发布并开源了Yi系列中的“理科状元”——Yi-9B，可在魔搭体验

ModelScope

1,474

亦达

2025-02-20

746

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

746

王明橙鲤黄俊

2024-05-15

64142

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

64,142

ModelScope

2024-05-15

1155

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,155

一默

2024-08-26

326

打破传统叙事逻辑，构建基于原子化任务的人机交互

在复杂中后台设计中，为解决配置变更影响多场景问题，提出结合正向和逆向信息架构，采用原子化任务，动态组合任务，降低用户和开发成本，优化体验并改变已有的产品迭代和人机交互模式。未来可能发展为AI自动根据业务规则和用户行为生成最佳方案。

一默

326

付宇轩

2024-09-14

764

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

阿里云函数计算与 NVIDIA TensorRT/TensorRT-LLM 展开合作，通过结合阿里云的无缝计算体验和 NVIDIA 的高性能推理库，开发者能够以更低的成本、更高的效率完成复杂的 AI 任务，加速技术落地和应用创新。

付宇轩

764

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

智能理解 PPT 内容，快速生成讲解视频

大模型推理服务全景图

快速定位进程性能瓶颈

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

通义千问开源模型在PAI灵骏的最佳实践

LISA微调技术解析：比LoRA更低的显存更快的速度

打破传统叙事逻辑，构建基于原子化任务的人机交互

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

智能理解 PPT 内容，快速生成讲解视频

大模型推理服务全景图

快速定位进程性能瓶颈

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

通义千问开源模型在PAI灵骏的最佳实践

LISA微调技术解析：比LoRA更低的显存更快的速度

打破传统叙事逻辑，构建基于原子化任务的人机交互

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地