「镁客·请讲」图鸭科技武俊敏:打造从压缩、通信到分析的完整视频解决方案

简介:

图像压缩技术已经存在20多年,20年来技术不断地推进,导致其技术门槛越来越高。

我们经常会遇到这种状况,想要把图片压缩的又小又能保持图片的高清度;想要在语音聊天时保持通话流畅;想要在视频时保持视频的清晰度和流畅度……

图鸭科技就是这样一家公司,他们主要研发图片压缩通信传输视频分析技术与产品。

每个起点都不简单——高起点的图像压缩技术

图鸭科技的CEO是来自上海交通大学的武俊敏。武俊敏在创立图鸭科技前曾在专门做3G手机视频直播业务的掌赢科技当过首席科学家,主要研究人脸美化和表情迁移技术。

武俊敏在掌赢科技积累了许多关于人脸美化和表情迁移的技术,例如表情迁移用到小波变换、非线性TensorFlow等算法。而图像压缩是通过损失较少的比特存储空间或不损耗比特,来表示原来像素矩阵,其使用的算法种类更多也更加复杂。可以说人脸美化、表情迁移与图像压缩技术是两个完全独立的技术。武俊敏的创业基于自身的学习基础,转向一个新的技术方向。而这个新方向要困难的多。

图鸭科技武俊敏:打造从压缩、通信到分析的完整视频解决方案

(图:图鸭科技CEO武俊敏)

“图像压缩技术已经存在20多年,20年来技术不断地推进,导致其技术门槛越来越高。”武俊敏说道,“因此,我在一开始请教了许多师兄和前辈,一起研究图像压缩的算法。”对于创业公司来说,开始都是困难的,资金、人才、技术可能都处于一个不完善的状态。但是,这些困难必须一个个解决掉,做不下去就要死去。

必须相信技术会不断进步——升级打造完整视频解决方案

自2016年8月创建以来,接近一年半的时间,图鸭科技在图像压缩方面取得了不俗的成绩。其图像压缩与JPEG相比,压缩率提升了70% 多,和WebP相比压缩率提高了60% 多。即在保持相同图像峰值信噪比的同时,极大减少了存储空间。此技术能帮助需要大量传输、储存图片的企业节省一大笔开支。

不过,在图像压缩取得不错成绩后,武俊敏团队发现,海量和高清的图片和视频对通信的要求很高。因此,图鸭对图像和音视频的通信传输进行了研究。

在2017年年初完成千万级天使轮融资后,图鸭科技造的音视频传输解决方案延时低至50-100ms。其内容主要包括保证质量的前提下,允许免费接入VoIP SDK,零成本实现实时音视频通讯功能。同时,通讯效果普遍优于Skype、微信等大众品牌。

图鸭还提供了所有涉及通讯方式的功能模块,打通了Android、iOS、Mac和Windows等平台,一站式服务,保证节约接入和成本维护,使使用其系统的厂商不再为各个模块接入SDK厂商不同而烦恼。

同时,图鸭不仅提供一站式服务,还为开发者提供了便利平台。“去年年底VolP技术的服务器源代码和客户端网络模块代码已经开源,开发者可以进行二次开发。”武俊敏表示。

为了推动压缩技术的进一步发展,武俊敏将压缩和模式识别的技术融合,相互借鉴,创造性地得到了较好的压缩效果。但是武俊敏对其技术发展还不满意。

图鸭科技武俊敏:打造从压缩、通信到分析的完整视频解决方案

(图:公司视频分析项目展示)

所以,图鸭科技在不断进行技术创新的同时,又更加深入的探索视频智能分析技术。视频智能分析不仅使用到了已有的表情迁移和人脸美化技术,还需要利用深度学习人脸识别算法,对视频进行检测和分类,提取视频关键帧和关键段落。

这样,公司就形成了一套完整的视频解决方案,从视频的压缩,到通信传输,再到视频的分析。

就像社会进化论被很多理论学家质疑,“技术会不断的进步”也被许多人质疑。对于此,武俊敏认为,技术会不断的进步已经成为技术工作者的一种价值取向,“你只有相信技术会不断地进步,才会不断地去努力去实践,这样才有可能出成果。而不去实践,是永远不会出成果的。”

有道是,春江水暖鸭先知——迎接5G和AR设备的爆发点

虽然图鸭科技已经做出了一套完整的视频解决方案,但是目前的分析系统能力还不够强,其准确度和时间复杂度并没有达到令武俊敏满意的程度。

武俊敏说:“目前的分析系统要达到其基本要求,还需要1年时间,要达到满意的要求约需一年半的时间。整个2018年,要将视频解决方案上线并做好。”

目前,图鸭科技在准备下一轮pre-A的融资,并打算在今年6月份之前完成。融资将被用于技术升级和公司运营。当问到图鸭科技是否会在视频解决方案之外,开拓一些新的应用,武俊敏表示,“在公司技术发展成熟满意之前,无意向其他业务方向扩散。对于一家科技公司来说,技术就是命根子。”武俊敏说道。

图鸭科技武俊敏:打造从压缩、通信到分析的完整视频解决方案

(图:图鸭科技团队)

就像电影《阿甘正传》的台词一样,“未来就像一盒巧克力,你永远不知道下一颗是什么味道。”对于图鸭科技和武俊敏来说,把眼光聚焦于当前技术的发展才是重中之重

而在静心发展已有技术的同时,仍要对未来的机会保持高度的敏锐度。众所周知,当5G时代带来的时候,将会给现有的视频等数据传输带来变革性的变化。对此武俊敏说,“5G的到来将会推动公司的发展。5G时代带来的更多的视频量和更多的存储需求,而基础的光纤网络设备并没有太多的改进,因此对于整套视频解决方案的要求也会更大。”同时,AR眼镜的爆发也会为企业带来新的生机。对于这两个机会,图鸭科技会力求抓住。有道是“春江水暖鸭先知”。

结语:

目前,国内做视频压缩、传输和分析的整套视频解决方案的企业并不多。国外的此类公司也大都只做其中某个方向,做出整个完整技术流程的并不多。因此,图鸭科技的压缩技术和整套视频解决方案有极大的竞争优势。而且,图鸭科技的解决方案已经部分了落地,用在了智能门禁远程视频传输无人店等场景。


原文发布时间: 2018-01-31 14:30
本文作者: Lotusun
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关文章
|
云安全 安全 Cloud Native
|
人工智能 运维 安全
对话汇量科技副总裁奚原:如果把先进算法比喻成矛,那稳定的平台与算力便是配套的盾
持续了三年之久的新冠疫情让全球企业遭遇了前所未遇的挑战,国内互联网行业格局更是日渐稳固,想要保持营收上的高速增长变得越来越困难。危局之下,“出海”成为国内企业,尤其是互联网企业寻求持续增长的新出路。
262 0
王宝强离婚成了谁的狂欢?——通过阿里云·数加严肃解读数据背后的媒体传播路径
2016年8月14日凌晨,正当许多夜猫在为奥运会损耗青春的肉体,一条突如其来的微博推送想必让无数人倍感精神,似乎拥有“上帝视角”的每个他或她已成为暗夜里的裁判,义愤填膺地点评其中的“背叛”、“阴谋”、“道德”、“财产”。 第二天,宝宝的离婚门继续发酵,与“张继科内裤”为代表的奥运热点一起包揽了微博
39741 0
|
机器人 Java 程序员
首次公开!三代技术人深度对话,《云上朗读者》开放下载
阿里云 MVP历时上百天,走近各行各业一线技术人,倾听他们成功背后的故事。蒋江伟(小邪)推荐——18位在前线的阿里云 MVP不为人知的心路历程,科技发展与经济格局的变化,抓住时代机遇勇于创新,从容面对挑战,走近三代技术人解锁他们对新基建与云上未来的深刻洞见。
27415 0
首次公开!三代技术人深度对话,《云上朗读者》开放下载
|
存储 编解码 数据管理
完美网络体验背后的技术力量,《阿里云互联网多媒体数据存储解决方案蓝皮书》震撼上线!
依托于环境,启蒙于困境,多媒体技术逐步进入快速发展的阶段,《阿里云互联网多媒体存储解决方案蓝皮书》应运而生,为多媒体行业的数字化进程提供有力保障。
1159 0
完美网络体验背后的技术力量,《阿里云互联网多媒体数据存储解决方案蓝皮书》震撼上线!
「镁客·请讲」小库科技何宛余:用人工智能去更高效的协助建筑设计工作
何宛余认为,在建筑设计过程中,有些工作不应该由人来完成。
730 0
下一篇
无影云桌面