韩嫕:坚持coding

简介: 与韩嫕结识得益于大师兄(FFmpeg社区的刘歧)的推荐,大约2个月前我正在为LiveVideoStackCon 2019深圳寻找讲师,韩嫕和她的团队正在探索通过AI实现自动化剪辑,提升后期编辑的效率。 在此次大会上,韩嫕将会就这一话题详细介绍他们的实践与经验。

文 / 韩嫕


策划 / LiveVideoStack


LiveVideoStack: 韩嫕你好,很高兴代表LiveVideoStack采访你。 第一个问题,你是如何进入到多媒体技术领域,并一步一步走到今天的?

 

韩嫕: 我在大学和研究生的时候主要学习方向就是通信工程,重点学习内容集中在图像、视频编解码方面。 个人爱好摄影、摄像和制作视频。

 

毕业后进入央视国际网络有限公司工作,由于自己通信和多媒体学科背景的原因,选择了在手机视频方面继续工作。 从视频编转码、支撑平台搭建、客户端开发、手机应用做起。 2009年开始工作以来,经历过MTK、Symbian再到后来的安卓、iOS、MeeGo、WindowsPhone,基本上从2009年开始随着移动网络的发展,一直从事跟移动多媒体相关的工作。

 

在个人成长中担任过技术开发、项目管理、产品设计、技术架构师、内容运营、市场拓展和部门管理等一系列的工作,目前在央视频融媒体发展有限公司担任技术负责人。

 

LiveVideoStack: 如果让你重新选择技术领域,你还会选择多媒体吗? 大数据,人工智能的价值也越来越大。

 

韩嫕: 我想个人可能还是会选择多媒体领域。 一个是个人兴趣使然,另外一方面我觉得视频行业在未来的互联网或者物联网发展中将会是一种基础能力,我们也看到越来越多的云公司将视频云定位为其基础服务能力,我还是非常看好这个行业的。 大数据和人工智能已经普及到了各个行业领域,视频行业也不例外。 目前我们也在重点探索将人工智能与传统视频行业的结合,无论在生产制作、传输分发和用户体验上利用大数据和人工智能来优化。


LiveVideoStack: 有没有一些关键人、经历或一本书等,对你产生了重大影响。

 

韩嫕: 对我影响比较大的人挺多的,最重要的是我的家人,从他们身上学习到的是一种对于工作的忠诚和坚持,以及不停敦促自己学习进步的生活态度。 我也有一个精神上的偶像是乔布斯,那种对于产品的极致体验近乎极端的苛刻追求和对于科学和技术绝对的尊重是我非常欣赏并且也希望学习的精神,同时我比较坚信世界上没有抄袭的成功,坚持和一条道走到黑,是成功路上很重要的法宝。 最后是身边的团队,团队中有很多厉害的人,当有共同目标的时候所有人可以相互支持、互相补台的工作氛围是我可以快速成长的重要因素。

 

LiveVideoStack: 如果让你来总结掌握好多媒体技术的关键,你会给出哪些建议?

 

韩嫕: 我觉得在多媒体技术方面工作,最重要的是实践和挖掘新场景下的应用形态。 技术要成为服务于行业、服务于用户的重要转移是与应用场景相结合。 我看到过很多新技术苦于没有应用场景融合迟迟无法推向市场。 其次我建议应该多去了解和学习新的技术。 最后建议想在技术领域发展的朋友可以至少每周要坚持有一些实践和实操,坚持做一些coding方面的工作。


LiveVideoStack: 说说你目前的工作内容和研究方向吧。

 

韩嫕: 目前工作中我团队的主要精力 是在做中央广播电视总台的一款新的App,完成整体平台设计和搭建,是一款视频产品。 所以团队还是集中在视频领域,除了常规视频的编解码、传输分发、调度管理这些外,也在大数据和人工智能方面结合视频特征有一些探索和研究。 比如对于视频信息内容的识别和标记、视频编码过程中通过引入AI能力进行视频增强和超分等工作。 最近我们重点在探索5G环境下4K、互动视频、大小屏交互的场景,包括其内容的采集、制作、分发和传输相关的技术点。 我们重点研究5G环境下新视频的新体验内容。

 

LiveVideoStack: 能否剧透下你将在LiveVideoStackCon 2019深圳上分享的内容?

 

韩嫕: 本次LiveVideoStackCon2019深圳站,我将带来基于人工智能的视频AI拆条的一些探索和实践经验,结合国庆大阅兵和目前电视频道节目的特征,针对综艺节目、赛事等拆条的一些相关内容分享。

 

LiveVideoStack: 展望2020年,你看好哪些多媒体相关的技术,在哪些行业及应用场景得到进一步发展,甚至爆发?

 

韩嫕: 2020年5G将会给多媒体行业带来更多的机会。 同场体验的视频观感应该会成为一种新的趋势,在这样的氛围下用户需要更多的参与体验和互动体验。 我个人还比较看好互动视频以及MR方式的沉浸式视频方向。 教育、培训、养老陪护等方面应该有机会成为视频场景服务的爆发点。

————————————————

版权声明:本文为CSDN博主「LiveVideoStack_」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/102813066


「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。

阿里云视频云@凡科快图.png

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
自然语言处理 语音技术 开发者
微软NaturalSpeech语音合成推出第三代
微软推出NaturalSpeech 3,第三代文本到语音(TTS)系统采用创新的因子化扩散模型,无需先例样本即可生成自然、高质量语音。该技术通过分解语音为内容、韵律等属性并独立处理,实现更精细控制,提高语音自然度。使用神经编解码器和因子化向量量化,以及新的因子化扩散模型,增强了语音合成的可控性和质量。在大规模训练基础上,NaturalSpeech 3在多项指标上超越现有TTS系统,并具备数据和模型扩展性。微软已通过开源项目分享研究成果,推动行业进步,但未来仍需解决多语言、少数据场景的挑战及技术伦理问题。
627 5
微软NaturalSpeech语音合成推出第三代
|
数据可视化 BI
探索ERP系统的移动端应用与移动办公解决方案
探索ERP系统的移动端应用与移动办公解决方案
671 2
|
智能硬件
硬件产品成本构成
硬件产品成本
995 1
|
网络安全 Apache
Apache服务器安装SSL证书
Apache服务器安装SSL证书
532 0
|
算法 编译器 Linux
【Qt4 部署】ARM系统上使用Qt 4 进行开发的QWS 等环境变量部署
【Qt4 部署】ARM系统上使用Qt 4 进行开发的QWS 等环境变量部署
654 0
|
Shell Android开发 容器
你真了解Android任务栈 Task 与启动模式吗?
你真了解Android任务栈 Task 与启动模式吗?
412 0
OOP有哪些优点?
【7月更文挑战第17天】OOP有哪些优点
416 2
|
存储 开发框架 搜索推荐
【Uniapp 专栏】Uniapp 打造的音乐类应用案例剖析
【5月更文挑战第12天】使用Uniapp跨平台框架开发的音乐应用,提供丰富音乐库和个性化推荐,用户可轻松搜索、创建歌单及离线收听。应用采用先进音频技术确保流畅播放,设计简洁美观,集成社交分享功能。通过优化搜索和推荐系统,提升用户体验。此案例展现了Uniapp在音乐应用开发的优势和潜力,为开发者带来启示。
456 2
|
数据挖掘 Python
如何将动态IP代理转换为静态IP代理的方法与步骤
如何将动态IP代理转换为静态IP代理的方法与步骤
828 6
|
Web App开发 移动开发 JavaScript
移动端实现拍照功能——两种方法
移动端实现拍照功能——两种方法