人机交互新进展:LFR-DFSMN语音识别声学模型介绍
语音识别技术是人机交互技术的重要组成部分,而语音识别中的声学模型是语音识别技术中的核心所在,堪称重中之重。阿里巴巴iDST智能语音交互团队最新的LFR-DFSMN模型相对于之前的LFR-LCBLSTM模型可以达到训练加速3倍、识别加速2倍、识别错误率降低20%和最终模型大小压缩50%的效果,实现了语音识别的迭代速度、识别成本、服务质量的全面提升。
SLAM+AR 技术与应用的一些思考
图像处理领域涉及AR的技术可以抽象为这么一类技术:通过图像和其他传感器信息计算摄像机的位置和图像内环境三维结构信息,并结合3D渲染提供更自然的人机交互能力。
2. VPP源码分析(内存管理之抽象数据结构)
1.2. 抽象数据结构
1.2.1. vector
CLIB vectors are ubiquitous dynamically resized arrays with by user defined "headers".