聊聊我从底层算法到业务算法转型的这一年

简介: 聊聊我从底层算法到业务算法转型的这一年




我们新推出大淘宝技术年度特刊《长期主义,往往从一些小事开始——工程师成长总结专题》,专题收录多位工程师真诚的心路历程与经验思考,覆盖终端、服务端、数据算法、技术质量等7大技术领域,欢迎一起沟通交流。

本文为此系列第七篇内容。

第一篇:负责淘宝业务前端开发9年,聊聊我的心得

第二篇:“技术开发最应该做什么?”,聊聊我在服务端开发5年的理解和收获

第三篇:聊聊我在淘宝做性能分析的经历

第四篇:聊聊我做NeRF-3D重建性能优化的经历

第五篇:聊聊我在店铺开放域做性能优化的体会

第六篇:聊聊我在淘宝的成长公式和业务思考



作者潇岑来自安徽,本科毕业于东南大学自动化专业,硕博就读于中国科学技术大学自动化系,博士课题是视频去抖动算法研究。

个人经历


众所周知,自动化是个大杂烩专业,所以我在校期间还接触过单片机、嵌入式、电子电路等偏硬件工作。博士毕业后,我去到华为南研所,在那里接触了视频编解码、图像分割相关工作。2018年,我入职阿里,工作内容仍然是偏底层的视觉算法工作,包括视频去噪、去压缩失真、视频增强、目标跟踪等。21年十一之后我主动转岗来到了大淘宝技术,之后开始转型,纯算法工作不再是工作重心,而是偏向于淘宝直播和短视频业务方面,将所学用于提升淘宝直播和短视频画质、体验方面,我还需要做很多很多努力。


这段时间的工作和感受


说回到过去的这一年,从转岗到现在,我做过的事情比较多,包括纯算法开发调优、算法接入、业务技术等技术性工作,也做过纯业务需求方,给团队内部同事提需求来实现业务目标,大部分时间,我其实是部门的画质体验业务的接口人,由我来对接集团内画质评测相关业务,以及淘宝主播、商家、机构和行业小二们提出的直播画质体验提升相关需求。



过去的这一年里,在我和同事们的努力下,淘宝直播的画质得到了显著的提升,接到的吐槽,也越来越少了。越来越多的主播实现了高画质开播的诉求,每当看到来自他们的肯定的表情包,我都会在屏幕这一头露出老母亲似的微笑,这种成就感是我以前做纯算法工作得不到的,起码不那么直接、快速和巨大、频繁。我越来越觉得自己的转岗是正确的,自己正走在一条正确的道路上。再回想自己这一路走来,到底经历过多少次挫折,走过多少弯路,寻求的其实就是一种业务价值的体现,寻求那种雪中送炭的感觉,寻求肯定,而不是无休止地在同一个算法上反复打磨,获得了非常多的打补丁、调优的技巧,却没有办法落地。


印象深刻的几件事

回想过去这一年里,我过的十分充实,感触也颇多,其中印象最深刻的是这么几件事。

  1. 第一件事其实是个碰钉子的故事,也给我很多触动:
    我本以为我作为画质方面的技术小二,定位出画质体验比较差的主播之后我的工作就结束了,剩下的交给产品和运营,由他们帮我联系主播、提升画质。但是,我完全错了,首先,运营人员很分散,每个人只负责几个头部主播,画质较差的头部主播太少,剩下大量的中腰部主播,还是要靠我们自己搞定。于是,我被逼无奈,写了一套自动化归因低画质原因的程序,生成几千个主播的低画质原因,然后通过消息盒子分别推送给主播们。我记得,在那个冬天的早上,我收到第一条反馈过来的主播的钉钉消息的时候,我是从床上跳起来的。这证明路走通了,我们可以不用完全仰仗关注点根本不在直播画质上的产品和运营了。
    这件事,也让我认识到,什么叫全力以赴拿结果和此时此刻非我莫属,因为,这个工作,只有我在做,我只有使出浑身解数,才能做成。万事开头难,关键时刻,不能把希望完全寄托在别人身上,关键还是节奏太慢,不能指哪打哪,更不能一下打几千个主播。
  2. 第二件事是个服务于业务的技术性工作——低画质直播间实时检测功能上线:
    件事,是纯粹用技术服务于业务,过程没什么好说的,关键是,这是我第一次完整走完了一个上线流程,有需求讨论、排期、部署上线、测试和最终发布,也看到了实际运行的效果。

    之前在预研型部门做纯算法时的上线流程,其实就相对简单,一线算法同学不参与需求讨论和最终上线,只拿到任务,然后开发算法、做测试报告,其他的交给工程团队就好。
    这件事让我感受到,大淘宝技术这边,跟以前的部门不一样,在这边做事有一种owner的感觉,也没有人在卷相同的事情,不存在因为多做了一点,就跟别人踩脚,因为这件事里面我的事情很多,而且其他人的事情,我也参与不了,所以团队之间的配合反而更流畅一点。
  3. 第三件事说回跟主播的接触,也是我持续在做和给我最多感触的事情:
    目前为止,我负责的多个主播群里,成员包括主播、商家和机构,其中1对1接触过占据一半,有top主播,KA商家,也有腰部和中小主播。有的是通过低画质提醒消息找过来的,有的是运营推过来的,剩下的就是通过推广出去的文档、群二维码找过来的。对于真正深入接触过的主播们,我都认真服务过他们,包括推荐设备、调试建议等等,作为回报,他们也为我的工作成果贡献了不少,我们互相成就。
    在接触中,我能深切感受到,屏幕背后的这些人,往往都对应一个个中小企业,他们跟我一样,也在为自己的工作、生活、家人而努力工作。很多人虽然没什么文化,但是能混到现在这个地位,也是经历过不少风浪挫折和成功后的喜悦。所以,我一般都会很尊重他们,他们对我也很尊重。我们素未谋面,在他们心里,我可能是个经验丰富的老师傅,但其实,我只是为他们服务比较热心而已,很多事情我也是跟他们的接触中慢慢学会的。
    在这里,我真正体会到了什么叫客户第一,尤其是深夜里,本来已经忙了一天准备睡觉,主播的钉钉、电话来了,我也必须得接,因为他们往往都很着急,即使我不能立刻解决,也得负责安抚,并找到可以解决问题的人进来一块查问题,给主播吃一颗定心丸,告诉他们,他们不会没人管。而问题解决之后,主播往往也不会吝啬于发来表情包给我们点赞。
    另外,跟这么多主播接触过,也成为我在团队内的一项不可替代的优势,只有我可以拿到主播们第一手的反馈,只有我对淘宝直播这个业务最了解。而淘宝直播这个完整链路里如果有什么问题,我也可以第一时间收到反馈。


    主播发来贺电
  4. 第四件事就是我作为需求方,给相关团队提需求。由于我接触的主播比较多,所以见过的主播的问题也比较多,这其中包括一些投诉、反馈,我也总结出一些建议,会给到相关团队,比如增强、美颜、绿幕算法的改进,和马赛克、掉帧相关的处理。

总结
过去的这一年,对我来说是非常有意义的一年,我完成了渴望已久的转型。对任何人而言,转型都不是一件容易的事情,需要极强的决心和外部推动力,而我,也确实是经历了一次转岗,才完成这个转变。
我的工作不再是拘泥于某几个小点上反复打磨,我有了更多的时间来思考自己的价值和工作方向,我找到了拿到业务结果的方法,我学会了与不同领域的人沟通,这些都是我以往所追求的转变。
未来的一年,我将更多凭借过去这一年的工作成果、感悟来指引自己的前进方向,因为我知道哪些点最需要重点投入解决,比如让画面更好看又更真实,让特写更流畅清晰更真实,让评测更准确来及时发现和定位问题,这些,我可能都将会以不同的角色参与进去。


团队介绍


淘宝音视频技术团队负责淘宝的音视频算法和相关基础技术,尤其是保障视频高画质和流畅度。通过视频编码器 S265、视频增强方案 STaoVideo、无参考视频质量评价模型 MD-VQA、媒体处理系统 TMPS 以及低延时传输网络 GRTN 的接入,打造业界领先的音视频体验。通过持续的技术打磨和算法创新力求高质量、低成本赋能淘宝内容业务,助力淘宝内容化战略,所沉淀的平台技术和产品能力亦可被集团其它业务复用。这些多年来沉淀的技术能力,也曾经在多个音视频核心技术的国际权威比赛中折桂。

相关文章
|
设计模式 算法 Java
关于编程模式的总结与思考(上)
关于编程模式的总结与思考(上)
158 0
|
安全 测试技术 数据库
测试流程规范--准入准出规则
为了加强测试部软件测试的质量控制及与测试相关部门、人员更好理解测试各阶段的准入/准出条件而建立的准入/准出规范。
2806 0
测试流程规范--准入准出规则
|
10月前
|
人工智能 运维 安全
阿里云研发副总裁蔡德忠受邀参加乌镇峰会,畅谈AI与下一代互联网
2024年乌镇峰会“下一代互联网论坛”近日举办,主题为“创新驱动,安全赋能,共筑开放与安全的下一代互联网”。阿里云智能集团研发副总裁,基础设施网络研发负责人蔡德忠受邀参与圆桌讨论,并就人工智能(AI)与下一代互联网的融合发展分享了前瞻性见解。
|
4月前
|
机器学习/深度学习 JSON 算法
京东拍立淘图片搜索 API 接入实践:从图像识别到商品匹配的技术实现
京东拍立淘图片搜索 API 是基于先进图像识别技术的购物搜索接口,支持通过上传图片、URL 或拍摄实物搜索相似商品。它利用机器学习和大数据分析,精准匹配商品特征,提供高效、便捷的搜索体验。接口覆盖京东海量商品资源,不仅支持外观、颜色等多维度比对,还结合用户行为数据实现智能推荐。请求参数包括图片 URL 或 Base64 编码,返回 JSON 格式的商品信息,如 ID、价格、链接等,助力消费者快速找到心仪商品,满足个性化需求。
334 18
|
机器学习/深度学习 编解码 算法
AIGC生图的自动化质量评估(1)
AIGC生图的自动化质量评估
600 6
|
人工智能 API 决策智能
智胜未来:国内大模型+Agent应用案例精选,以及主流Agent框架开源项目推荐
【7月更文挑战第8天】智胜未来:国内大模型+Agent应用案例精选,以及主流Agent框架开源项目推荐
15101 134
智胜未来:国内大模型+Agent应用案例精选,以及主流Agent框架开源项目推荐
|
供应链 Java 测试技术
开发Java应用时如何用好Log
开发Java应用时如何用好Log
285 3
|
存储 机器学习/深度学习 测试技术
mnn-llm: 大语言模型端侧CPU推理优化
mnn-llm: 大语言模型端侧CPU推理优化
1756 1
|
分布式计算 DataWorks 大数据
MaxCompute产品使用合集之odps.sql.mapper.split.size和odps.stage.mapper.split.size这两个参数的区别是什么
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
机器学习/深度学习 编解码 算法
【前沿解读】17篇2023淘天业务技术A类顶会论文(上)
【前沿解读】17篇2023淘天业务技术A类顶会论文(上)
457 2