小米、vivo、苹果新机几乎同期扑面而来,让业界嗅到智能手机的一个热点:“人脸识别”——小米Note 3、vivo V7+、iPhone X都支持刷脸解锁,另外一个热点是“全面屏”,然而智能手机蓄势待发的技术何其多:机器智能、千兆级LTE、2X2双通路Wi-Fi、射频前端、快充等等(如下图)让人猝不及防,为了搞清楚这些炫酷的招数,我们采访了高通工程技术副总裁ChienChung (CC) Chang,梳理出智能手机之4件热门技术。
图:高通持续深耕智能手机的技术研发
人脸识别的门槛之一是3D传感器技术
3D传感器技术的重要性在于它可以表现出很多2D无法表达的东西。通俗点说,当人脸识别那几秒,3D能感应到人脸轮廓中凹凸不平的部位,比如眼睛是凹进去的,耳朵是凸出来的,但如果是2D,这些器官都会显示在同一平面中。
人脸识别的第一步,需要3D成像——结构光模组负责采集深度数据、与摄像头接收的2D影像数据整合,从而形成完整的3D影像。这显然要求多个模组(结构光发射端、结构光接收端、前摄像头等)有团队协作精神。
而高通在这一领域耕耘多年,高通第二代Spectra ISP支持人脸识别技术和3D深度感知技术。在3D深度感知方案上,高通采用面向计算机视觉、图像质量和功效提升而设计的全新摄像头架构,以完成密集的深度图生成、图像分割等各种智能视觉应用。
图解高通3D深度传感器,利用红外线接受三维深度数据,形成高分辨率的深度数据,可以准确识别人脸,即使在低光环境下也能进行三维重建
高通与奇景光电同时还在加快推进SLiM(结构光模组)3D解决方案,可以为厂商提供完整的3D摄像头模组和技术。除了手机之外,汽车、无人机、监视器等产品也都会广泛使用这个技术。
有消息称,SLiM的3D摄像头模组方案将会在明年1月份量产,而搭载它的安卓手机也会在明年Q1亮相。
ChienChung (CC) Chang延伸介绍了高通3D深度传感器技术的其他应用(如下图)。第一个应用是将单反相机的景深感测功能迁移到手机上,可以将镜头聚焦某一个人,背景虚化,呈现出一种单反拍人的效果;还有一个应用是VR的感测避障功能,如果戴上VR眼镜的你周遭环境很黑暗,VR眼镜内置的3D传感器可以帮你感测四周障碍物,以免磕伤撞伤。
H.265编码是4K视频的好帮手
通常我们看网络视频,流量会跑得很快,保存视频也会占用大量存储,这是因为视频未被压缩、占用带宽的缘故。ChienChung (CC) Chang告诉我们,假如一段每秒30帧的高清视频未经过压缩,那么每秒约使用10亿比特(带宽单位),而压缩之后,每秒可以降低到2000万比特。结论就是,压缩技术可以将视频的大小缩减到原有版本的1/50。
国际上有许多视频压缩的标准,最新的一项标准是H.265高效率视频编码(High Efficiency Video Coding,简称HEVC),由ITU-T视频编码专家组与ISO/IEC动态图像专家组联合成立的视频编码联合协作组(JCT-VC)在2013年建立,很多公司参与建立了这一标准,高通也参与其中。
图:HEVC驱动多媒体消费革命,有益于OEM厂商、视频供应商、内容创作者
H.265 标准被认为不仅提升视频质量、缩减带宽成本,还能达到上一代 H.264/MPEG-4 AVC 两倍之压缩率——等于同样画质下,比特率减少了50%,存储大小相同的条件下,使用H.264只能录2个小时的视频,H.265则可以录4个小时。H.265 还能支持 4K 甚至超高清电视(UHDTV),最高分辨率可达 8192×4320(8K 分辨率)。
随着手机、电脑、相机、电视的摄像头、视频解析度逐渐往越来越高分辨率发展,H.265编码迎来了风口。“高通是H.265标准的主要支持者和开发者,其中多项技术都是由高通团队负责研发的。”ChienChung (CC) Chang介绍。
高通正致力于推动中国主要的视频供应商和内容制造者使用H.265标准,意味着国内的视频压缩技术水平能再向前迈进一步。而在国外,随着苹果最新一代手机和电视使用H.265标准,包括安卓手机在内的其他手机制造商,以及包括Netflix和YouTube在内的视频内容供应商,都会迅速跟上这股潮流。
HOA对音频的贡献也很大
谈完视频,音频自然必不可少,然而不论什么场景,音频质量最重要的一点是令人感到身临其境的“临场感”。声音的临场感不只来自于周围360度的环境,也来自四面八方,这些来源构成了立体的三维空间,只有当声音以一种三维立体环绕的方式传入耳朵时,人们才会产生临场感。
在这个过程中,如何通过麦克风收集三维空间中的音频信息,经过压缩后再传输到另一边,并不比视频压缩技术简单。
高通研发出一项技术叫HOA(Higher Order Ambisonics,高阶高保真立体声)。在实际操作中,它虚拟设置了一个360度的球状麦克风,麦克风搜集不同方向的声音,经由一个虚拟的数学函数值对声音进行加权,再把函数的加成值进行压缩,最后传输出去。所以,这个音频文件可以利用很低的频段传输。这是HOA的基本功能。
更重要的功能在于,经过压缩的声音可以通过HOA技术在不同的环境里播放。例如,电视机只有两个喇叭,汽车上有很多喇叭,而会议厅和音乐厅里有更多喇叭。有了HOA技术,无论设备有多少个喇叭,都可以根据喇叭向四面八方播放,让人产生身临其境的感觉。
图:HOA(Higher Order Ambisonics,高阶高保真立体声),沉浸式音频的新标准
也就是说,假如你身处音乐厅,无论坐在什么位置,听的声音都是一样,都能感受到与收音最好的位置一样的临场感。该技术将来也能适用于VR眼镜,即使观众不在现场,也不影响试听享受。
超声波指纹识别大行其道
指纹识别虽是如今手机的标配,仍然有优胜劣汰之分。ChienChung (CC) Chang说,目前智能手机大多使用电容式指纹识别,存在局限性:碰到手过于潮湿、不太干净、抹完护手霜等情况,指纹识别的效果会变差。
在上一代Snapdragon Sense™ ID指纹技术基础上,高通今年推出了新一代指纹传感器,支持全新增强的特性,包括面向显示屏、玻璃和金属的传感器、定向手势检测、水下指纹匹配和设备唤醒,是首个商用发布的集成式超声波移动解决方案。
这种技术的优势在于,超声波可以穿透很高很厚的地方,可以透过玻璃面板和厚至 650 微米铝材质外壳实现扫描,即使手上有水也很容易识别出。
另外一个巨大的优势是,超声波指纹识别可以说是手机全面屏的前提。因为目前大部分手机屏幕下方都有一个按键,用来指纹解锁,电容式指纹识别技术无法安置在屏幕底下,也就无法摒弃屏幕下方的按键,而超声波指纹识别因为穿透性强的原因,可以实现屏幕底下识别,即使全面屏也不在话下。
高通超声波指纹识别还有一个优势在于,可以避免用户的指纹被盗用。因为超声波要求用户必须用手指接触屏幕,而超声波会深入皮肤下层,感应到血液的流动,以此辨别手指和纸片的区别。符合美国FBI(美国联邦调查局)标准。
ChienChung (CC) Chang透露,为了研发超声波指纹技术,高通与面板和屏幕制造商都达成了合作。