「镁客·请讲」图鸭科技武俊敏:打造从压缩、通信到分析的完整视频解决方案

简介:

图像压缩技术已经存在20多年,20年来技术不断地推进,导致其技术门槛越来越高。

我们经常会遇到这种状况,想要把图片压缩的又小又能保持图片的高清度;想要在语音聊天时保持通话流畅;想要在视频时保持视频的清晰度和流畅度……

图鸭科技就是这样一家公司,他们主要研发图片压缩通信传输视频分析技术与产品。

每个起点都不简单——高起点的图像压缩技术

图鸭科技的CEO是来自上海交通大学的武俊敏。武俊敏在创立图鸭科技前曾在专门做3G手机视频直播业务的掌赢科技当过首席科学家,主要研究人脸美化和表情迁移技术。

武俊敏在掌赢科技积累了许多关于人脸美化和表情迁移的技术,例如表情迁移用到小波变换、非线性TensorFlow等算法。而图像压缩是通过损失较少的比特存储空间或不损耗比特,来表示原来像素矩阵,其使用的算法种类更多也更加复杂。可以说人脸美化、表情迁移与图像压缩技术是两个完全独立的技术。武俊敏的创业基于自身的学习基础,转向一个新的技术方向。而这个新方向要困难的多。

图鸭科技武俊敏:打造从压缩、通信到分析的完整视频解决方案

(图:图鸭科技CEO武俊敏)

“图像压缩技术已经存在20多年,20年来技术不断地推进,导致其技术门槛越来越高。”武俊敏说道,“因此,我在一开始请教了许多师兄和前辈,一起研究图像压缩的算法。”对于创业公司来说,开始都是困难的,资金、人才、技术可能都处于一个不完善的状态。但是,这些困难必须一个个解决掉,做不下去就要死去。

必须相信技术会不断进步——升级打造完整视频解决方案

自2016年8月创建以来,接近一年半的时间,图鸭科技在图像压缩方面取得了不俗的成绩。其图像压缩与JPEG相比,压缩率提升了70% 多,和WebP相比压缩率提高了60% 多。即在保持相同图像峰值信噪比的同时,极大减少了存储空间。此技术能帮助需要大量传输、储存图片的企业节省一大笔开支。

不过,在图像压缩取得不错成绩后,武俊敏团队发现,海量和高清的图片和视频对通信的要求很高。因此,图鸭对图像和音视频的通信传输进行了研究。

在2017年年初完成千万级天使轮融资后,图鸭科技造的音视频传输解决方案延时低至50-100ms。其内容主要包括保证质量的前提下,允许免费接入VoIP SDK,零成本实现实时音视频通讯功能。同时,通讯效果普遍优于Skype、微信等大众品牌。

图鸭还提供了所有涉及通讯方式的功能模块,打通了Android、iOS、Mac和Windows等平台,一站式服务,保证节约接入和成本维护,使使用其系统的厂商不再为各个模块接入SDK厂商不同而烦恼。

同时,图鸭不仅提供一站式服务,还为开发者提供了便利平台。“去年年底VolP技术的服务器源代码和客户端网络模块代码已经开源,开发者可以进行二次开发。”武俊敏表示。

为了推动压缩技术的进一步发展,武俊敏将压缩和模式识别的技术融合,相互借鉴,创造性地得到了较好的压缩效果。但是武俊敏对其技术发展还不满意。

图鸭科技武俊敏:打造从压缩、通信到分析的完整视频解决方案

(图:公司视频分析项目展示)

所以,图鸭科技在不断进行技术创新的同时,又更加深入的探索视频智能分析技术。视频智能分析不仅使用到了已有的表情迁移和人脸美化技术,还需要利用深度学习人脸识别算法,对视频进行检测和分类,提取视频关键帧和关键段落。

这样,公司就形成了一套完整的视频解决方案,从视频的压缩,到通信传输,再到视频的分析。

就像社会进化论被很多理论学家质疑,“技术会不断的进步”也被许多人质疑。对于此,武俊敏认为,技术会不断的进步已经成为技术工作者的一种价值取向,“你只有相信技术会不断地进步,才会不断地去努力去实践,这样才有可能出成果。而不去实践,是永远不会出成果的。”

有道是,春江水暖鸭先知——迎接5G和AR设备的爆发点

虽然图鸭科技已经做出了一套完整的视频解决方案,但是目前的分析系统能力还不够强,其准确度和时间复杂度并没有达到令武俊敏满意的程度。

武俊敏说:“目前的分析系统要达到其基本要求,还需要1年时间,要达到满意的要求约需一年半的时间。整个2018年,要将视频解决方案上线并做好。”

目前,图鸭科技在准备下一轮pre-A的融资,并打算在今年6月份之前完成。融资将被用于技术升级和公司运营。当问到图鸭科技是否会在视频解决方案之外,开拓一些新的应用,武俊敏表示,“在公司技术发展成熟满意之前,无意向其他业务方向扩散。对于一家科技公司来说,技术就是命根子。”武俊敏说道。

图鸭科技武俊敏:打造从压缩、通信到分析的完整视频解决方案

(图:图鸭科技团队)

就像电影《阿甘正传》的台词一样,“未来就像一盒巧克力,你永远不知道下一颗是什么味道。”对于图鸭科技和武俊敏来说,把眼光聚焦于当前技术的发展才是重中之重

而在静心发展已有技术的同时,仍要对未来的机会保持高度的敏锐度。众所周知,当5G时代带来的时候,将会给现有的视频等数据传输带来变革性的变化。对此武俊敏说,“5G的到来将会推动公司的发展。5G时代带来的更多的视频量和更多的存储需求,而基础的光纤网络设备并没有太多的改进,因此对于整套视频解决方案的要求也会更大。”同时,AR眼镜的爆发也会为企业带来新的生机。对于这两个机会,图鸭科技会力求抓住。有道是“春江水暖鸭先知”。

结语:

目前,国内做视频压缩、传输和分析的整套视频解决方案的企业并不多。国外的此类公司也大都只做其中某个方向,做出整个完整技术流程的并不多。因此,图鸭科技的压缩技术和整套视频解决方案有极大的竞争优势。而且,图鸭科技的解决方案已经部分了落地,用在了智能门禁远程视频传输无人店等场景。


原文发布时间: 2018-01-31 14:30
本文作者: Lotusun
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关文章
|
计算机视觉
Opencv学习笔记(十二):图片腐蚀和膨胀操作
这篇文章介绍了图像腐蚀和膨胀的原理、作用以及使用OpenCV实现这些操作的代码示例,并深入解析了开运算和闭运算的概念及其在图像形态学处理中的应用。
860 1
Opencv学习笔记(十二):图片腐蚀和膨胀操作
|
存储 NoSQL 关系型数据库
|
5月前
|
机器学习/深度学习 存储 算法
印刷字体识别系统
一个基于Python的印刷字体识别系统,遵循 GNU_GPL_v3 许可,具备字体倾斜校正、行与字符分割及字符识别功能。采用HOG算法训练SVM模型,使用Chars74K数据集。系统包含简单UI,支持动态加载和结果展示。核心算法包括自适应扩展+连通域辅助的行分割,以及垂直投影+连通域+极小值法细分粘连字符的字符分割。项目文件结构清晰,涵盖图像处理、模型训练与加载等功能模块。
186 6
|
5月前
|
机器学习/深度学习 人工智能 算法
人机融合智能 | 以人为中心人工智能新理念
本文探讨了“以人为中心的人工智能”(HCAI)理念,强调将人的需求、价值和能力置于AI设计与开发的核心。HCAI旨在确保AI技术服务于人类,增强而非取代人类能力,避免潜在危害。文章分析了AI的双刃剑效应及其社会挑战,并提出了HCAI的设计目标与实施路径,涵盖技术、用户和伦理三大维度。通过系统化方法,HCAI可推动AI的安全与可持续发展,为国内外相关研究提供重要参考。
395 3
|
5月前
|
机器学习/深度学习 弹性计算 Linux
阿里云服务器租用价格:云服务器ECS/轻量/GPU收费标准与活动价格参考
阿里云服务器产品主要包括云服务器ECS、轻量应用服务器以及GPU云服务器等。为了方便大家了解阿里云各类服务器的价格信息,本文整理汇总了阿里云服务器、轻量应用服务器、GPU云服务器的最新收费标准以及活动价格情况,供大家参考选择。
|
网络协议 Java Linux
PyAV学习笔记(一):PyAV简介、安装、基础操作、python获取RTSP(海康)的各种时间戳(rtp、dts、pts)
本文介绍了PyAV库,它是FFmpeg的Python绑定,提供了底层库的全部功能和控制。文章详细讲解了PyAV的安装过程,包括在Windows、Linux和ARM平台上的安装步骤,以及安装中可能遇到的错误和解决方法。此外,还解释了时间戳的概念,包括RTP、NTP、PTS和DTS,并提供了Python代码示例,展示如何获取RTSP流中的各种时间戳。最后,文章还提供了一些附录,包括Python通过NTP同步获取时间的方法和使用PyAV访问网络视频流的技巧。
3139 4
PyAV学习笔记(一):PyAV简介、安装、基础操作、python获取RTSP(海康)的各种时间戳(rtp、dts、pts)
|
存储 文件存储 云计算
云计算中的云存储技术对比:技术深度与未来趋势
【7月更文挑战第5天】云计算中的云存储技术多种多样,每种技术都有其独特的优势和应用场景。随着技术的不断发展和应用场景的不断拓展,云存储技术将朝着智能化、自动化、多云/混合云、数据安全与隐私保护以及边缘计算与分布式存储等方向发展。未来,云存储技术将继续为云计算的广泛应用提供坚实支撑。
1111 3
|
10月前
|
存储 程序员 编译器
什么是内存泄漏?C++中如何检测和解决?
大家好,我是V哥。内存泄露是编程中的常见问题,可能导致程序崩溃。特别是在金三银四跳槽季,面试官常问此问题。本文将探讨内存泄露的定义、危害、检测方法及解决策略,帮助你掌握这一关键知识点。通过学习如何正确管理内存、使用智能指针和RAII原则,避免内存泄露,提升代码健壮性。同时,了解常见的内存泄露场景,如忘记释放内存、异常处理不当等,确保在面试中不被秒杀。最后,预祝大家新的一年工作顺利,涨薪多多!关注威哥爱编程,一起成为更好的程序员。
491 0
|
机器学习/深度学习 并行计算 PyTorch
如何搭建深度学习的多 GPU 服务器
如何搭建深度学习的多 GPU 服务器
如何搭建深度学习的多 GPU 服务器
【Qt 学习笔记】Qt窗口 | 标准对话框 | 文件对话框QFileDialog
【Qt 学习笔记】Qt窗口 | 标准对话框 | 文件对话框QFileDialog
3213 4