叶琰：AI压缩技术在追上传统编码技术-阿里云开发者社区

叶琰：AI压缩技术在追上传统编码技术

2021-03-18 782

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 认识叶琰是经朋友引荐，在了解她的背景后很快决定邀请她来LiveVideoStackCon2019深圳，并担任了大会的Co-chair。叶琰给我留下的印象是坦诚、直接，一旦她承诺的事情会按时做到——无论是为大会内容组织给出建议，推荐讲师候选人，还是本篇采访，叶琰总是在deadline前完成，也许当年兼顾孩子和工作的艰难经历，让她更加游刃有余。如果一切顺利，叶琰将作为大会Co-chair在LiveVideoStackCon 2019深圳致辞，并和听众交流。

文 / 叶琰

策划 / LiveVideoStack

LiveVideoStack：叶琰你好，很荣幸代表LiveVideoStack采访你。第一个问题，我想了解为什么对video codec领域情有独钟？我研究了你的Linkedin，如果从IBM实习算起，你已经在这个领域20年了。

叶琰：这个其实并没有太多刻意的原因。我在读博士的期间的两个主要专业方向是通信理论和信号处理，而视频编解码是一个将信息论和数字信号处理里面的很多理论融合在一起来解决一个非常重要的实际应用的技术方向。近年来因为互联网和智能手机的发展给大家的生活带来了巨大的改变，视频应用拉近了人与人之间的距离，所以虽然过了这么多年，这个方向不但没有过时，反而在大家日常生活中占据着越来越重要的地位。

LiveVideoStack：上个世界九十年代末，从中科大毕业后，出国到加州大学取得了博士学位，此后一直在海外工作。直到2018年来到阿里巴巴，是怎样的机缘让你走出这样一条路径呢？

叶琰：我在上一个公司做了很多年视频技术方向的主管负责人，有不少技术和管理成果，也一直挺开心的。因为一个机缘巧合，有个在阿里巴巴工作的好朋友大力介绍这个机会，我抱着随便试试的态度聊了一下以后，发现中国互联网公司是一个很不一样的世界，可以提供更加广阔的天地，所以抱着在一个新的环境里进一步锻炼自己能力的想法就来了。

LiveVideoStack：过去二十年，恰恰国内科技、互联网快速发展的二十年，从web 1.0到电商、社交、在线教育、娱乐，如今移动互联网已无处不在。是否感叹“错过了最好的二十年”呢？

叶琰：这个还真从来没有过。我不但没有觉得自己错过了什么，正好相反我觉得过去的20年我从国外的职业生涯中学到了很多，技术和管理能力上也有不少的成长。相信我这些过去的经验都可以让未来的20年变得更好。

LiveVideoStack：能否介绍下你和你的团队在阿里巴巴达摩院的工作吗？我注意到，你的title中还包括“Machine IntelligenceTechnology Lab”，这是否揭示了一个事实：视频技术与AI将密不可分？

叶琰： AI技术近些年发展得很快，在视觉，图像和视频领域都开始得到广泛的应用。阿里巴巴达摩院机器智能实验室的视频团队在视频编解码，视频理解，视频审核，智能生产等方面都有先进技术开发并在业务上落地。从视频编解码这个领域来看，基于AI的压缩技术目前还赶不上像HEVC或者VVC这样的国际视频压缩标准的压缩性能，这个gap如何去弥补将是我们的挑战之一。达摩院的同学都有很高的技术水准，所以相信我们的团队会尽全力给出一个好的答案。

LiveVideoStack：在阿里巴巴工作，此前经历的公司有什么不同吗？

叶琰：国内互联网公司节奏快，团队更加年轻有冲劲。而国外公司的团队在经验积累上可能更加有优势一些。

LiveVideoStack：我们再来谈一个现实问题——多媒体相关的技术人供给不足，更多的学生愿意选择AI，甚至金融这些能更快带来物质回报的领域，你如何看待这个问题？

叶琰：你说的这个不太乐观的现象在一定程度上是存在的。但是我更愿意从乐观的角度去看这件事，我觉得在这样的环境下还是会选择来做多媒体技术人的同学们更加代表我们是真正志同道合的技术人，而能够和志同道合的同学们一起做些事情，真的是个非常快乐的事情。

LiveVideoStack：你在接受视频采访时曾说过“人是一种非常坚强的动物，再苦再难也要挺着”，能说说你所经历的最艰难的日子吗，是怎么挺过来的？

叶琰：采访时候说的话应该是针对为人父母的艰辛而发的感慨。尤其是在国外工作生活的双职工，孩子小的时候同时要juggle家庭和工作两边，很多人应该都有过感觉要崩溃的经历。在这种时候我觉得能够得到家人和朋友的帮助是最重要的。所以每个人都要维护一个健康的朋友人际网，还有就是要相信自己，相信困难都是暂时的。

LiveVideoStack：最后一个问题，我发现一个现象——相当一部分视频编码相关的技术专家都来自清华大学（虽然没有做过精确额统计），比如Google的多媒体组基本上清一色的来自清华大学。作为一名中科大的毕业生，你怎么看这一现象？

叶琰：这个说法好像和我的感觉不太一样。光是做视频标准的其实我就认识不少科大人，在公司做算法和产品开发的就更多了。 2018年4月份VVC的CfP中有一篇是中国4大院校的联合响应，这4所院校是科大，北大，哈工大和武汉大学。所以只看Google一个公司一个团队就得出结论说相当的视频编解码技术专家都是清华的，这种说法恐怕有失偏颇。

————————————————

原文链接：https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/103168947

「视频云技术」你最值得关注的音视频技术公众号，每周推送来自阿里云一线的实践技术文章，在这里与音视频领域一流工程师交流切磋。

阿里云视频云@凡科快图.png

叶琰：AI压缩技术在追上传统编码技术

阿里云视频云

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

叶琰：AI压缩技术在追上传统编码技术

阿里云视频云

热门文章

最新文章

相关课程

相关电子书

相关实验场景