官方博客-第17页-阿里云开发者社区

阿里云云原生

2025-01-24

800

智能理解 PPT 内容，快速生成讲解视频

本方案利用函数计算 FC 部署 Web 应用，调用百炼模型服务实现 PPT 到视频的自动转换。视觉模型智能理解 PPT 图文内容，快速生成相匹配的解说词；文本模型对解说词进行优化，提高其可读性和吸引力；语音模型则根据解说词生成生动流畅的旁白音频。整个过程高度集成，只需一键操作，系统即可自动整合图片、文本和音频素材，快速生成对应讲解视频。

阿里云云原生

800

阿里云开发者

2025-04-24

1161

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,161

德歌

2023-09-14

25871

沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力

本文将带领大家来体验一下如何将“千问大模型+文本向量化模型”植入到PG|PolarDB中, 让数据库具备AI能力.

德歌

25,871

阿里云大数据Al技术

2024-05-15

78237

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

78,237

ModelScope

2024-05-15

1952

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,952

寒斜

2024-11-19

770

基于事件驱动构建 AI 原生应用

AI 应用在商业化服务的阶段会面临诸多挑战，比如更快的服务交付速度，更实时、精准的结果以及更人性化的体验等，传统架构限制于同步交互，无法满足上述需求，本篇文章给大家分享一下如何基于事件驱动架构应对上述挑战。

寒斜

770

阿里云云原生

2025-01-22

624

AI 短剧遇上函数计算，一键搭建内容创意平台

为了帮助更多内容创作者和企业快速实现 AI 短剧创作，函数计算 FC 联合百炼联合推出“AI 剧本生成与动画创作解决方案”，通过函数计算 FC 构建 Web 服务，结合百炼模型服务和 ComfyUI 生图平台，实现从故事剧本撰写、插图设计、声音合成和字幕添加到视频合成的一站式自动化流程。创作者只需通过简单操作，就能快速生成高质量的剧本，并一键转化为精美的动画。

阿里云云原生

624

阿里云云原生

2025-05-06

1318

MCP 规范新版本特性全景解析与落地实践

MCP Specification 在 2025-03-26 发布了最新的版本，本文对主要的改动进行详细介绍和解释

阿里云云原生

1,318

闵子

2023-12-01

2885

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

2,885

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

智能理解 PPT 内容，快速生成讲解视频

为什么一定要做Agent智能体？

沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力

【AAAI 2024】MuLTI：高效视频与语言理解

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

基于事件驱动构建 AI 原生应用

AI 短剧遇上函数计算，一键搭建内容创意平台

MCP 规范新版本特性全景解析与落地实践

从浏览器原理出发聊聊Chrome插件

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

智能理解 PPT 内容，快速生成讲解视频

为什么一定要做Agent智能体？

沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力

【AAAI 2024】MuLTI：高效视频与语言理解

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

基于事件驱动构建 AI 原生应用

AI 短剧遇上函数计算，一键搭建内容创意平台

MCP 规范新版本特性全景解析与落地实践

从浏览器原理出发聊聊Chrome插件