浪潮服务器进驻科大讯飞 语音输入法识别更快更精准

简介:

2016年底,锤子科技CEO罗永浩的手机发布会意外捧红了科大讯飞的语音输入法,发布会上,老罗用很快的语速随口说了一段内容,屏幕几乎同步“打”出文字,一字不差。尽管会场环境嘈杂,讯飞输入法仍然能准备无误地识别,不得不让人惊叹。科大讯飞的语音输入法也一夜蹿红,百度搜索指数显示,近期关键词“讯飞输入法”的搜索量大增,7天搜索指数环比增长139%。近日科大讯飞宣布,讯飞输入法的用户数已突破4亿,活跃用户达1.1亿,居世界中文输入法第二位。

讯飞输入法是科大讯飞在2010年推出的一款输入软件,集语音、手写、拼音等多种输入方式于一体,从首个版本发布开始,语音输入就是其最大亮点,准确率高达97%,可支持粤语、四川话、东北话、上海话等近20种方言语音输入。这一切都源于深度学习的理念,即通过模拟人脑进行分析学习,使机器从大量历史数据中学习规律,从而对新的样本做智能识别,以达到具有人类一样的思考能力。

精准识别 让机器更懂你

为了提升智能语音的识别率,科大讯飞很早就提出了“讯飞超脑计划”,计划将模拟人脑神经元的1/10,以期其智能语音设备拥有初步的人类思考能力。通过长期的语音数据积累,目前讯飞输入法已获得了海量的语音数据,而想要实现更精准的语音说识别,就必须以更大规模、更多存储的超算集群和更优的深度学习并行化及集群调度算法,应对数千倍训练数据和数千倍模型参数的挑战。

此外,讯飞输入法还针对重度语音用户提出了个性化方案,随着用户使用时间的积累,对用户习惯的学习和个人语音词库的积累,能否让语音输入法的识别效果更佳准确。同时,讯飞输入法为了满足语音输入中对语种翻译的需求,还将增加“随声译”功能,不仅有中英文互译,还将升级加入中韩和中日的语音翻译,为此,科大讯飞决定新上一批服务器来支撑偏向VIP用户的个性化识别应用以及新增的随声翻译功能。

科大讯飞相关负责人谈到:“语音输入时,在极短的时间内,输入法的语音识别系统经历了一个极为复杂的分析过程,很多环节容易导致语音识别出现问题。比如对发音人‘口音差异’的适配,需要海量数据进行适应训练,使语音识别系统习惯不同人的发音;另外还有环境噪声干扰,在语音输入过程中,机器很难分辨出人声和环境噪声,容易把所有的声音都进行识别;再者是网络因素,在线语音识别需要通过网络在服务端与客户端传输数据,网络质量差或传输不稳定易导致语音识别慢、效果差,这些都成为了阻碍语音识别普及的因素。因此,在采购硬件设备时,我们更加关注服务器的计算速度、存储能力、扩展性等问题,从硬件上就开始避免上述问题。”

浪潮双路 离人工智能更近一步


科大讯飞经过多方考察和综合衡量后,最终选择了浪潮双路旗舰服务器NF5280M4构建高性能计算集群。科大讯飞相关负责人介绍到:“我们一个团队目前所用的GPU大概就有400多块,但是现在的神经网络链接数只是10的8次方,跟真正的人脑差了近6个数量级,显然这400块是远远满足不了实际需求的,我们需要计算速度更快、而且带宽更大的服务器,浪潮的NF5280M4能够更好地满足我们的要求。”

浪潮服务器进驻科大讯飞 语音输入法识别更快更精准

浪潮NF5280M4

浪潮NF5280M4采用全新智能计算加速技术,可根据应用需求智能调节,作为集群节点为平台提供强劲的计算能力;支持浪潮F-LOM技术,实现极速网络I/O,可根据应用的网络带宽需求,进行自由扩展,实现网络性能飞跃;最大可搭载29块硬盘,超大存储容量满足海量数据存储需求,帮组系统进行模拟训练,提升识别精确度,提高识别速度。此外,NF5280M4具有业界最顶级的扩展能力,可支持8个PCI-e插槽,最大可支持3个GPU卡作为协处理器,为科大讯飞的人工智能语音识别所需要的庞大运算量提供坚实的硬件保障。

未来已来 万物互联改变生活

浪潮很早之前就与科大讯飞在深度学习领域展开了合作,浪潮服务器更是获得了科大讯飞的认可,尤其是依托浪潮双路服务器NF5280M4,讯飞输入法的实时中文语音转写获得了用户的广泛好评,以59%的语音用户渗透率,处于中国语音输入法领先地位;而科大讯飞在2016年度发布会上展示的全新多语种翻译技术,实时将中文演讲翻译成英语、日语、韩语、维吾尔语并同步展示在大屏幕上,更是引发强烈关注。

科大讯飞董事长刘庆峰在年度发布会上谈到,随着万物互联时代到来,以语音为主、键盘触摸为辅的人机交互正逐渐成为刚需,人工智能产业迎来第三次发展浪潮。未来5到10年,人工智能会像水和电一样成为我们生活的必需品,深刻改变我们的世界。



原文发布时间为: 2017年2月17日

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
11天前
|
人工智能 Cloud Native 数据库
“云+AI”浪潮下,阿里云&龙蜥携手打造智算时代最佳服务器操作系统
AI 时代的来临,也推动着云计算发展迎来第三次浪潮。
|
24天前
|
负载均衡 网络协议 安全
|
2月前
|
存储 安全 数据安全/隐私保护
Web应用程序的会话管理是一种跟踪和识别特定用户与Web服务器之间交互的技术
【5月更文挑战第12天】Python Web开发中,会话管理用于跟踪用户与服务器交互,如Flask框架提供的内置功能。以下是一个简单示例:安装Flask后,设置应用密钥,通过session读写用户状态。例如,创建一个显示和设置用户名称的Web应用,用户提交的名字将保存在会话中。在生产环境中,应安全存储密钥,如使用环境变量。扩展会话管理可借助第三方库实现更多功能,但可能需更多配置。
234 2
|
2月前
|
人工智能 安全 Linux
在云智融合浪潮下,服务器操作系统产业的未来发展将更加注重性能、安全性、稳定性以及对于AI和云计算的支持
在云智融合浪潮下,服务器操作系统产业的未来发展将更加注重性能、安全性、稳定性以及对于AI和云计算的支持
35 4
|
2月前
|
人工智能 安全 Linux
在云智融合浪潮下,服务器操作系统产业的未来发展将更加注重性能、安全性、稳定性
在云智融合浪潮下,服务器操作系统产业的未来发展将更加注重性能、安全性、稳定性以及对于AI和云计算的支持【2月更文挑战第21天】
35 4
|
2月前
|
Linux 应用服务中间件 nginx
国服浪潮服务器操作系统——KeyarchOS多容器架设体验心得
国服浪潮服务器操作系统——KeyarchOS多容器架设体验心得
67 0
|
2月前
|
人工智能 Linux 云计算
【专访浪潮信息】构建开放公平的社区生态,中国服务器操作系统崛起进行时
服务器操作系统产业 2.0 时代,龙蜥社区和浪潮信息的创新、挑战与突破。
|
2月前
|
运维 数据可视化 大数据
浪潮信息云峦服务器操作系统KeyarchOS体验与实践
浪潮信息云峦服务器操作系统KeyarchOS体验与实践
83 0
|
存储 C语言
浪潮NF8480 M5服务器HBA卡BUG处理
浪潮NF8480 M5服务器HBA卡BUG处理
189 0
|
达摩院 API 计算机视觉
阿里云三个月服务器试用资格申请与使用、图像分割与人脸人体识别接口调用
阿里云三个月服务器试用资格申请与使用、图像分割与人脸人体识别接口调用
118 0