使用AI识别语音和B站视频并通过GPT生成思维导图原创

简介: AI脑图现新增语音及B站视频内容识别功能,可自动生成思维导图。用户可通过发送语音或上传语音文件,系统自动转换为文本并生成结构化的思维导图;对于B站视频,仅需提供链接即可。其工作流程包括:语音转文本、文本结构化、生成Markdown、Markdown转思维导图HTML以及输出最终的思维导图图片给用户。

AI脑图除了对文本、网页链接和文件生成思维导图外,现在也支持了对语音和B站视频的内容识别,并自动生成思维导图。

语音生成思维导图

直接发送语音:对AI脑直接发送语音(如使用语音说厦门三天两夜的旅行攻略),AI脑图会使用语音识别AI能力,自动识别出语音内容文本,再根据内容文本要求生成结构化易于理解的思维导图,并以图片形式下发给用户。
642.png

生成出的思维导图:
WechatIMG2.jpg

上传语音文件:支持多种音频格式,上传完成后AI脑图会使用语音识别能力识别出音频内容文本,然后提炼内容关键信息、结构化梳理,并生成思维导图,同时也可以下载识别好的内容原文PDF文件。(对话框里回复上传文件即可进入上传页面)
IMG_796B8F46F502-1.jpeg

B站视频生成思维导图

复制B站视频的网页链接,发送给AI脑图,即可以识别视频内容,提炼内容的关键信息、结构化梳理后生成思维导图,也可以获取视频识别成文字内容的PDF文件
640.png

获取识别成文字内容的PDF文件
641.png

总结AI脑图的工作流程:

1、使用腾讯云语音识别出语音内容文本
2、使用CHATGPT将内容文本生成易于理解和结构化的markdown格式文本
3、利用markmap工具将markdown生成思维导图HTML文件
4、将思维导图HTML文件生成截图图片
5、下发图片给用户

目录
相关文章
|
2月前
|
人工智能
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
56 1
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
|
2月前
|
人工智能 前端开发 测试技术
探索前端与 AI 的结合:如何用 GPT-4 助力开发效率
本文介绍了 GPT-4 如何成为前端开发者的“神队友”,让开发变得更加高效愉快。无论是需求到代码的自动生成、快速调试和性能优化,还是自动化测试和技术选型,GPT-4 都能提供极大的帮助。通过智能生成代码、捕捉 BUG、优化性能、自动化测试生成以及技术支持,GPT-4 成为开发者不可或缺的工具,帮助他们从繁重的手动任务中解脱出来,专注于创新和创意。GPT-4 正在彻底改变开发流程,让开发者从“辛苦码农”转变为“效率王者”。
35 0
探索前端与 AI 的结合:如何用 GPT-4 助力开发效率
|
2月前
|
存储 人工智能 开发者
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
88 0
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
|
2月前
|
人工智能 语音技术 数据格式
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
39 0
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
|
2月前
|
人工智能 编解码 文字识别
阿里国际AI开源Ovis1.6,多项得分超GPT-4o-mini!
阿里国际AI团队提出了一种名为Ovis (Open VISion)的新型多模态大模型的架构。
DB-GPT 首期源码解读系列直播回顾(视频版)
🚀 DB-GPT首期源码解读系列上线啦! ✨直播视频看点满满:项目发起人陈发强亲临,初次剖析架构,完整呈现从设计思考到架构逻辑的全过程,让你全面了解 DB-GPT。
|
3月前
|
机器学习/深度学习 人工智能 编解码
深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
【9月更文挑战第2天】深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
 深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
|
2月前
|
人工智能 编解码 API
【选择”丹摩“深入探索智谱AI的CogVideoX:视频生成的新前沿】
【选择”丹摩“深入探索智谱AI的CogVideoX:视频生成的新前沿】
|
2月前
|
人工智能
用AI人模拟社会学实验,居然成功了?斯坦福、NYU用GPT-4模仿人类,准确度惊人!
斯坦福大学和纽约大学的研究团队利用GPT-4模型成功模拟了人类在社交互动中的行为模式,实验结果显示AI能以惊人准确度模仿人类对话,甚至在在线论坛和社交媒体上与真人难以区分。这一突破不仅展示了AI在社会学研究中的巨大潜力,还引发了对AI伦理和透明度的深入探讨。尽管存在一些局限性和挑战,这项研究为未来社会学实验提供了新工具和方法。[论文地址:https://docsend.com/view/qeeccuggec56k9hd]
62 2
|
3月前
|
人工智能
防AI换脸视频诈骗,中电金信联合复旦提出多模态鉴伪法,还入选顶会ACM MM
【9月更文挑战第26天】中电金信与复旦大学合作,提出一种基于身份信息增强的多媒体伪造检测方法,并入选ACM MM国际会议。该方法利用身份信息作为检测线索,构建了含54位名人324个视频的多模态伪造数据集IDForge,设计了参考辅助的多模态伪造检测网络R-MFDN,显著提升了检测性能,准确率达到92.90%。尽管如此,该方法仍存在一定局限性,如对非英语国家数据及无明确身份信息的视频检测效果可能受限。
69 4