免费将音频转成文字的快速方法

简介: 前言最近在看YouTube视频时,里面有自动字幕功能,当时非常激动,字幕很准确;其实YouTube这个功能在2010就上线了。今天就是想利用YouTube这个强大的功能,将音频转换成文本啊!因为尝试了讯飞和百度后,不只是收费,准确率也不好,特别是英文。

前言

最近在看YouTube视频时,里面有自动字幕功能,当时非常激动,字幕很准确;其实YouTube这个功能在2010就上线了。今天就是想利用YouTube这个强大的功能,将音频转换成文本啊!因为尝试了讯飞和百度后,不只是收费,准确率也不好,特别是英文。

自己的音频(视频)

如果是视频,直接在YouTube上传就可以,如果是音频,YouTube不接受纯音频文件。所以,我们得通过第三方网站 TunesToTube - Upload 上传,给音频配上画面。

上传音频后转换视频:

img_c6cec68b0a51e648fdbaffd35d03843c.png
Jietu20180223-230805.png

在YouTube视频管理,查看刚才上传的视频,需要等待一下,会自动生成字幕:

img_b70ae2c4aac36c71b7b57448e13a9b3d.png
Jietu20180223-231102.png

可以查看自动生成的字幕,并且下载!

img_bb4581a45678a7afb64149acbf3680a8.png
Jietu20180223-231146.png

YouTube的视频

如果是YouTube上已经有的视频,你想下载字幕,则可以通过第三方API来下载完整的字幕,以下是用 - YouTube字幕下载 网站示意:

img_762600cdbd525ffbd1453de66dee2614.png
Jietu20180223-232209.png

选择下载的字幕:

img_d191579cef5cc72ef90b14c9d006f437.png
Jietu20180223-232142.png

下载的字幕示意:

img_a20d8e0f4e318e0e32d26b1d066b7696.png
Jietu20180223-232557@2x.png

总结

随着今年AI人工智能的发展,谷歌的自动翻译已经给世界带来了巨大的改变,相反国内,其实一直在说AI,却没有做出大的变化,就像优酷,没有考虑谷歌的强大,一直与爱x艺视频,腾x视频都在为版本争,而且国内都是综艺视频占大头,有点可惜。希望,AI在未来能解决更多简单操作但繁琐的重复劳动工作的问题,一起加油!

参考引用


注:本文首发于 iHTCboy's blog,如若转载,请注来源

目录
相关文章
|
8月前
|
人工智能 自然语言处理 API
图片转音乐模型来了!Image to Music V2 :只需上传一张照片,自动转换成与图片内容匹配的音频!
图片转音乐模型来了!Image to Music V2 :只需上传一张照片,自动转换成与图片内容匹配的音频!
354 1
|
机器学习/深度学习 异构计算 Python
raw格式照片一键改变风格
raw格式照片一键改变风格
89 0
如何使用 MusicFab 将 SoundCloud音频转换为 WAV格式?
这篇文章为你展示了如何利用三方工具将SoundCloud音频转化为WAV格式以便进行兼容收听。
|
8月前
|
机器学习/深度学习 搜索推荐 计算机视觉
字节推出DreamTuner:只需提供一张图片,就能帮你生成与该图片主题风格一致的新图像
【2月更文挑战第17天】字节推出DreamTuner:只需提供一张图片,就能帮你生成与该图片主题风格一致的新图像
190 2
字节推出DreamTuner:只需提供一张图片,就能帮你生成与该图片主题风格一致的新图像
|
机器人 语音技术
神器 | 文本转语音,直接可以合成多人多风格音频了!
为了适应更多的音频使用场景和需求,近期我们将文本转语音服务进行了升级,全新的功能将成为你配音工具的不二之选。
493 1
|
移动开发 Unix Linux
多行文本转成一行的实现方法
多行文本转成一行的实现方法
|
8月前
|
存储 传感器 监控
工业相机如何实现实时和本地Raw格式图像和Bitmap格式图像的保存和相互转换(C#代码,UI界面版)
工业相机如何实现实时和本地Raw格式图像和Bitmap格式图像的保存和相互转换(C#代码,UI界面版)
297 0
|
安全 数据安全/隐私保护
大家都在用的福昕阅读器 foxit 你还不知道吗? 祛除水印&PDF转换&全功能解锁…
大家都在用的福昕阅读器 foxit 你还不知道吗? 祛除水印&PDF转换&全功能解锁…
146 0
|
前端开发 JavaScript 搜索推荐
文字水印的几种实现方式
文字水印是一种强提示,一般会用在前端展示敏感、权利声明等场景下。我们简单介绍几种方法。
498 0
文字水印的几种实现方式
|
算法 图形学 数据安全/隐私保护
Unity 之 音频类型和编码格式介绍
Inspector窗口显示多个导入设置。这些设置决定了:加载行为,压缩行为,质量,采样率,以及是否支持双声道音频。
487 0
Unity 之 音频类型和编码格式介绍