这个落泪的男人叫王坚
这个一直咬牙坚持的瘦弱大叔在阿里云事业部年会上失声痛哭,但即便眼泪止不住的流,他还手拿话筒,哽咽地给自己鼓气:“这几年我挨的骂甚至比我一辈子挨得骂还多,但是我不后悔。
人机交互新进展:LFR-DFSMN语音识别声学模型介绍
语音识别技术是人机交互技术的重要组成部分,而语音识别中的声学模型是语音识别技术中的核心所在,堪称重中之重。阿里巴巴iDST智能语音交互团队最新的LFR-DFSMN模型相对于之前的LFR-LCBLSTM模型可以达到训练加速3倍、识别加速2倍、识别错误率降低20%和最终模型大小压缩50%的效果,实现了语音识别的迭代速度、识别成本、服务质量的全面提升。
SLAM+AR 技术与应用的一些思考
图像处理领域涉及AR的技术可以抽象为这么一类技术:通过图像和其他传感器信息计算摄像机的位置和图像内环境三维结构信息,并结合3D渲染提供更自然的人机交互能力。
梦想照进现实 - AR/VR 篇 (作者:方如)
毋庸置疑,图像识别、三维感知与跟踪、人机交互和三维渲染是AR/VR 四个核心部分,从这些方面下功夫,在实战中做好技术积累,更好地实现新零售下的内容升级,为下一代的计算平台打基础。
在CES 2017大展上,Kino-mo公司的展台前面挤满了人。