据 VentureBeat 报道,百度今天宣布推出 SwiftScribe,一个能用人工智能转录音频文件的应用。
过去几年百度一直在研究其 DeepSpeech 软件的语音识别。去年,还推出了 TalkType,这是一个使用 DeepSpeech 的 Android 键盘。事实上,亚马逊、苹果、谷歌和微软都一直和百度一样在研究语音识别,但他们都没有解决较长时间音频的转录问题。
在 SwiftScribe 中,用户选择以 .wav 或 .mp3 格式上传文件,系统将自动处理它。30秒的文件10秒就能转录完毕,一分钟的文件只需不到30秒。“SwiftScribe 甚至可以处理任意文件中长达一小时时长的音频,但需要花费20分钟的时间来处理”,百度项目经理田武在接受 VentureBeat 采访时说。
目前,百度将 SwiftScribe 作为一项免费服务提供,不过田武表示在未来更多的是希望将它变成一项业务。
本文来自开源中国社区 [http://www.oschina.net]