开发者社区> ihtcboy> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

免费将音频转成文字的快速方法

简介: 前言 最近在看YouTube视频时,里面有自动字幕功能,当时非常激动,字幕很准确;其实YouTube这个功能在2010就上线了。今天就是想利用YouTube这个强大的功能,将音频转换成文本啊!因为尝试了讯飞和百度后,不只是收费,准确率也不好,特别是英文。
+关注继续查看

前言

最近在看YouTube视频时,里面有自动字幕功能,当时非常激动,字幕很准确;其实YouTube这个功能在2010就上线了。今天就是想利用YouTube这个强大的功能,将音频转换成文本啊!因为尝试了讯飞和百度后,不只是收费,准确率也不好,特别是英文。

自己的音频(视频)

如果是视频,直接在YouTube上传就可以,如果是音频,YouTube不接受纯音频文件。所以,我们得通过第三方网站 TunesToTube - Upload 上传,给音频配上画面。

上传音频后转换视频:

img_c6cec68b0a51e648fdbaffd35d03843c.png
Jietu20180223-230805.png

在YouTube视频管理,查看刚才上传的视频,需要等待一下,会自动生成字幕:

img_b70ae2c4aac36c71b7b57448e13a9b3d.png
Jietu20180223-231102.png

可以查看自动生成的字幕,并且下载!

img_bb4581a45678a7afb64149acbf3680a8.png
Jietu20180223-231146.png

YouTube的视频

如果是YouTube上已经有的视频,你想下载字幕,则可以通过第三方API来下载完整的字幕,以下是用 - YouTube字幕下载 网站示意:

img_762600cdbd525ffbd1453de66dee2614.png
Jietu20180223-232209.png

选择下载的字幕:

img_d191579cef5cc72ef90b14c9d006f437.png
Jietu20180223-232142.png

下载的字幕示意:

img_a20d8e0f4e318e0e32d26b1d066b7696.png
Jietu20180223-232557@2x.png

总结

随着今年AI人工智能的发展,谷歌的自动翻译已经给世界带来了巨大的改变,相反国内,其实一直在说AI,却没有做出大的变化,就像优酷,没有考虑谷歌的强大,一直与爱x艺视频,腾x视频都在为版本争,而且国内都是综艺视频占大头,有点可惜。希望,AI在未来能解决更多简单操作但繁琐的重复劳动工作的问题,一起加油!

参考引用


注:本文首发于 iHTCboy's blog,如若转载,请注来源

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
#yyds干货盘点# 前端歌谣的刷题之路-第一百零二题-回文字符串
#yyds干货盘点# 前端歌谣的刷题之路-第一百零二题-回文字符串
7 0
typescript73-创建自己的类型声明文件(项目内共享类型)
typescript73-创建自己的类型声明文件(项目内共享类型)
18 0
如何使用schematics快速创建全新的SAP Spartacus Storefront并启用SSR
如何使用schematics快速创建全新的SAP Spartacus Storefront并启用SSR
36 0
如何使用schematics快速创建全新的SAP Spartacus Storefront并启用SSR
如何使用schematics快速创建全新的SAP Spartacus Storefront并启用SSR
36 0
WPF 中的三维文字[转贴]
原文:WPF 中的三维文字[转贴] 原文: http://msdn.microsoft.com/msdnmag/issues/07/10/Foundations/default.
860 0
WPF 竖排文字
原文:WPF 竖排文字 ---恢复内容开始--- 想做一个WPF 文字竖排 类似上图。用在TabItem的header上面。    第一种挺无聊的   2.wpf 装换器 public object Convert(object value, Type targetType, object parameter, System.
1842 0
文字换行
一般的元素都有设置自动换行的自动换行:word-wrap: break-word;word-break: normal;强制不换行:white-space:nowrap;CSS设置不转行:overflow:hidden 隐藏white-space:normal 默认 //***pre 换行和其他空白字符都将受到保护nowrap 强制在同一行内显示所有文本,直到文本结束或者遭遇 br 对象设置强行换行word-break:normal ; 依照亚洲语言和非亚洲语言的文本规则,允许在字内换行break-all :  该行为与亚洲语言的normal相同。
819 0
OpenResy+Lua 利用百度识图 将图片地址解析成文字
LUA代码:(注:LUA里有一个调用百度识图的接口IP:123.125.115.189(stu.baidu.com),不知为什么我的虚拟机无法解析stu.baidu.com,所以我只能PING出IP来用。
1140 0
svg文字与图像
摘要:   svg与canvas一样都可以将文本和图像放在画布中,制作出不一样的效果。下面是如何使用svg来渲染文本与图像。 简介:   SVG的强大能力之一是它可以将文本控制到标准HTML页面不可能有的程度,而无须求助图像或其它插件。
1208 0
+关注
ihtcboy
iHTCboy 破得迷,了得知,方能学海无边; 热爱移动开发,目前致力于移动全栈开发
文章
问答
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载