文档备案控制台

开发者社区人工智能文章正文

使用AI识别语音和B站视频并通过GPT生成思维导图原创

2024-08-25 1419

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： AI脑图现新增语音及B站视频内容识别功能，可自动生成思维导图。用户可通过发送语音或上传语音文件，系统自动转换为文本并生成结构化的思维导图；对于B站视频，仅需提供链接即可。其工作流程包括：语音转文本、文本结构化、生成Markdown、Markdown转思维导图HTML以及输出最终的思维导图图片给用户。

AI脑图除了对文本、网页链接和文件生成思维导图外，现在也支持了对语音和B站视频的内容识别，并自动生成思维导图。

语音生成思维导图

直接发送语音：对AI脑直接发送语音（如使用语音说厦门三天两夜的旅行攻略），AI脑图会使用语音识别AI能力，自动识别出语音内容文本，再根据内容文本要求生成结构化易于理解的思维导图，并以图片形式下发给用户。

生成出的思维导图：

上传语音文件：支持多种音频格式，上传完成后AI脑图会使用语音识别能力识别出音频内容文本，然后提炼内容关键信息、结构化梳理，并生成思维导图，同时也可以下载识别好的内容原文PDF文件。（对话框里回复上传文件即可进入上传页面）

B站视频生成思维导图

复制B站视频的网页链接，发送给AI脑图，即可以识别视频内容，提炼内容的关键信息、结构化梳理后生成思维导图，也可以获取视频识别成文字内容的PDF文件

获取识别成文字内容的PDF文件

总结AI脑图的工作流程：

1、使用腾讯云语音识别出语音内容文本
2、使用CHATGPT将内容文本生成易于理解和结构化的markdown格式文本
3、利用markmap工具将markdown生成思维导图HTML文件
4、将思维导图HTML文件生成截图图片
5、下发图片给用户

文章标签：

人工智能

语音技术

自然语言处理

关键词：

AI gpt

视频GPT

语音GPT

yz20032004

目录

相关文章

卓伊凡

|

10月前

|

人工智能 API 数据安全/隐私保护

近期非常风靡非常逼真的AI视频内容由sora生成的视频是怎么回事？-优雅草卓伊凡

近期非常风靡非常逼真的AI视频内容由sora生成的视频是怎么回事？-优雅草卓伊凡

卓伊凡

1813 12 13

近期非常风靡非常逼真的AI视频内容由sora生成的视频是怎么回事？-优雅草卓伊凡

中杯可乐多加冰

|

11月前

|

人工智能 API 开发者

Dify x AiOnly平台：手把手教你调用GPT-5从零构建AI工作流！

本文介绍如何通过Dify与AiOnly平台，快速构建基于GPT-5等顶尖大模型的AI应用。涵盖环境部署、模型接入、工作流编排及实战案例，助力开发者低门槛打造专属聊天机器人，轻松实现AI应用落地。（238字）

中杯可乐多加冰

1171 6 6

TsingtaoAI

|

12月前

|

人工智能自然语言处理数据可视化

AI视频培训｜格律诗AI 视频创作与自媒体传播——某诗词学会

近日，TsingtaoAI派驻专家团队为某诗词学会学员交付《格律诗AI 视频创作与自媒体传播》培训。本课程精准切中行业痛点——传统诗词创作与现代传播方式的断层。课程摒弃泛泛而谈，直击实操：首日聚焦"工具认知+创作逻辑"，系统梳理即梦、可灵等国产AI工具在格律诗意象可视化中的差异化应用，如将"月光在指尖碎裂"转化为动态场景；次日深入"语音表达+自媒体运营"，传授用魔音工坊生成情感化配音、坤行数字人打造诗人形象的秘技，更结合抖音、小红书平台特性，解析"前5秒高光片段设计"等流量密码。

TsingtaoAI

913 3 3

汀丶人工智能

|

11月前

|

机器学习/深度学习人工智能自然语言处理

AI Compass前沿速览：Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型

AI Compass前沿速览：Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型

汀丶人工智能

1264 13 13

AI Compass前沿速览：Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型

汀丶人工智能

|

12月前

|

人工智能自然语言处理机器人

AI Compass前沿速览：Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型

AI Compass前沿速览：Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型

汀丶人工智能

642 9 9

AI Compass前沿速览：Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型

汀丶人工智能

|

11月前

|

机器学习/深度学习人工智能编解码

AI Compass前沿速览：PixVerse V5、gpt-realtime、Grok Code Fast、HunyuanVideo、OmniHuman-1.5、字节WaverAI视频、MiniCPM 4.5等

AI Compass前沿速览：PixVerse V5、gpt-realtime、Grok Code Fast、HunyuanVideo、OmniHuman-1.5、字节WaverAI视频、MiniCPM 4.5等

汀丶人工智能

589 3 3

AI Compass前沿速览：PixVerse V5、gpt-realtime、Grok Code Fast、HunyuanVideo、OmniHuman-1.5、字节WaverAI视频、MiniCPM 4.5等

modelscope

|

11月前

|

人工智能编解码自然语言处理

重磅更新！ModelScope FlowBench 支持视频生成 + 图像编辑，AI创作全面升级！

很高兴地向大家宣布，ModelScope FlowBench 客户端迎来重大功能升级！本次更新不仅正式支持了视频节点功能，还新增了图像编辑与IC-Light智能打光等实用功能，同时对多个图像处理节点进行了深度优化和扩展。现在，您只需在 FlowBench 中轻松串联节点，即可使用 Wan2.1/Wan2.2、Qwen-Image-Edit、FLUX Kontext、IC-Light等强大模型，轻松实现创意内容的生成与编辑。无论你是内容创作者、视觉设计师，还是AI技术爱好者，这次更新都将为你打开全新的创作边界。

modelscope

1227 14 14

蒋星熠Jaxonic

|

11月前

|

人工智能自然语言处理算法

现代AI工具深度解析：从GPT到多模态的技术革命与实战应用

蒋星熠Jaxonic，AI技术探索者，深耕代码生成、多模态AI与提示词工程。分享AI工具架构、实战应用与优化策略，助力开发者提升效率，共赴智能编程新纪元。

蒋星熠Jaxonic

490 4 4

汀丶人工智能

|

机器学习/深度学习人工智能编解码

AI-Compass LLM合集-多模态模块：30+前沿大模型技术生态，涵盖GPT-4V、Gemini Vision等国际领先与通义千问VL等国产优秀模型

AI-Compass LLM合集-多模态模块：30+前沿大模型技术生态，涵盖GPT-4V、Gemini Vision等国际领先与通义千问VL等国产优秀模型

汀丶人工智能

1235 6 7

AI-Compass LLM合集-多模态模块：30+前沿大模型技术生态，涵盖GPT-4V、Gemini Vision等国际领先与通义千问VL等国产优秀模型

热门文章

最新文章

GPT-4 太贵？试试这 6 个免费且优秀的替代方案

OpenAI重磅开源，全面拥抱GPT-3

OpenAI更新GPT-4等模型，新增API函数调用，价格最高降75%

如何安装 Auto GPT 4：分步指南

如何制作 ChatGPT 清晰有效咒语与Chat GPT高效交流——基础篇第二课

一键本地部署类GPT大模型，免费！

3、惊奇，竟然可以在ChatGPT的GPT-4模型让它扮演Linux服务器搭建K8s和docker环境

使用 Node.js、Socket.IO 和 GPT-4 构建 AI 聊天机器人

表现优于 GPT-4，ChemCrow 集成 13 种化学工具，增强大型语言模型的化学性能

首个多模态视频竞技场Video-MME来了！Gemini全面超越GPT-4o，Jeff Dean连转三次

AI生成的痕迹：我们如何检测机器撰写的文本

如何准确检测AI生成内容？这三大技术是关键

如何准确检测AI生成内容？这几种技术方法值得关注

AI生成的文本：如何识破机器的“笔迹”？

如何识别AI生成内容？探秘“AI指纹”检测技术

火眼金睛：如何检测文本内容是否出自AI之手？

AI检测技术：如何识别机器生成的“数字指纹”？

揭秘AI文本：当前主流检测技术与挑战

如何识别AI生成内容？这几点技术指标是关键

AI生成内容的“指纹”与检测技术初探

相关课程

更多

AI人像动漫画实操教学

视觉AI技术体系及趋势概述

AIGC无处不在，把AI应用构建于Serverless之上

【科技少年】AI领航员探索教程（赛前训练）

达摩院视觉AI精品课

AI开发者的Docker实践

相关电子书

更多

AI 原生应用开源开发者沙龙·上海站电子书

AI原生应用开发实战营—Serverless AI专场·北京

阿里云 AI 原生应用开发实战营

相关实验场景

更多

使用AI容器镜像部署Qwen大语言模型

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！