报告老板!这个阿里程序员每天上班就看别人接吻

简介:

我叫吉恒杉,29岁,是一名“吻戏鉴定师”。

和女朋友刚谈恋爱的时候,我说我的工作是训练计算机识别出吻戏镜头。她听完觉得特别不可思议,谁能给钱让你干这个呢?

如果你用手机、电脑看过视频,一定感受过进度条上的情节提示,可以迅速找到自己想看的明星或情节。

没错,这些就是我们干的!

0fb9a6f66ba6b3b6a5d3a86a53a8c481ac8a2b96

正经的,在优酷我们的岗位叫人工智能标注员。我每天训练机器识别“接吻”镜头,然后将成百上千幅内容各异的画面标注成两类——“接吻”和“非接吻”。“吻戏鉴定师”是同事们的戏称,但说实话,我挺喜欢。

选择这个工作,一开始是因为和我的硕士专业计算机视觉刚好吻合。通俗地讲,就是“教电脑看懂世界”。现在我每天教电脑看懂“什么是接吻”,可以说,契合度百分百了。当然,这个工作既给大家带来快乐和幸福,又能以工作的名义看网剧(哈哈哈哈哈……这个可能是重点),最爱《军师联盟》,吴秀波铁粉。

8cce2f03e544081571796e5935fd565628a9e3f4

做一名合格的人工智能标注员其实也不那么容易。身边越来越多的人用手机和电脑看视频,大家不仅是简单地看剧,还想看更精彩有趣的片段、集锦,更主动地找到自己最想看的明星或者场景。

要想实现搜索和智能编辑,还真需要不少“人工”。要给成百上千幅吻戏画面打上标签,先要探讨什么样的画面算是吻戏,制作模型应该怎么画,然后训练机器人识别什么场景是“接吻”,通过数次的技术调试,让机器人自动从海量视频中,迅速抓取场景。

8f6566b4d8761a8360d6fdff64803097956c82f4

因此如何教机器识别接吻成了首要的难题。我们要从图片库和视频中截出数千幅图片,从中一张一张标注出“接吻”的画面。这个过程叫做“数据标注”。

我们一天要标注几百张接吻的图像,最多时标注上千张,盯着电脑屏幕看一天,最后都有点麻木了。通常数据标注得越准确、数量越多,模型的效果就越好。自然,机器识别的效果就会更好。

b53820b7af009d28a8a21b574e805837034cb0d4

但是机器毕竟不是人,对有些复杂情况也无法识别。比如,有的接吻深情对视,而有的若即若离,团队里的伙伴们不得不打印出角度各异的“接吻”画面贴在墙上,一群人激烈讨论到底怎么才算“接吻”。

“吻戏鉴定”还需要根据机器的反应进行繁琐的后期调试。机器学习上千幅图片中的特征,然后再给机器一张“接吻”的画面,它就能认出来了。

目前,我们团队已经为2万多条吻戏打上了标签,一条5分钟的视频处理可在10秒内完成。比如《三生三世十里桃花》,每集50分钟的视频被切割成3000帧图片,机器只需要5秒就能挑出来杨幂和赵又廷的吻戏。

765ffbcef002c47a56ef1b248127e0b7e2016388

现在我和团队的小伙伴们还开始接触和研究其他场景,比如哭戏、打戏,接下来还要鉴定体育比赛中的射门、扑球、投篮、庆祝等画面,这样观众看视频时能很方便的去找到自己想看的情节。

当然在做标注的时候并不是每次都能成功,往往会因为一些小的差别,导致失败,重新再来。这就要求我们不光要看图片,还要时常“探班”,到比赛或节目现场去观察和体会每个场景、动作的细小差别。

aaa2d748db569ab4a39ad4e99ab8f0dacace466c

我们就想用自己的一点点努力,让你们看剧的时候,更爽一些。

好了,不说了,我要去训练机器识别古力娜扎和迪丽热巴了。


原文发布时间为:2018-08-9

本文作者:橙子

本文来自云栖社区合作伙伴“阿里味儿”,了解相关信息可以关注“阿里味儿”。

相关文章
|
机器学习/深度学习 数据采集 分布式计算
阿里云机器学习平台PAI介绍|学习笔记
快速学习阿里云机器学习平台PAI介绍
5258 0
阿里云机器学习平台PAI介绍|学习笔记
|
数据可视化 API 数据库
低代码/无代码运动:软件开发的未来还是乌托邦?
低代码/无代码(LCNC)平台近年来在软件开发领域引起广泛关注,通过简化界面和预构建模块,使非技术用户也能快速构建应用。本文探讨其潜在影响、优势与挑战,以及对传统开发的影响。核心优势包括快速开发、易于使用和成本效益;主要挑战则涉及定制化限制、性能问题和技术锁定。LCNC平台促使开发者角色转变,促进业务与IT融合,并加速创新。尽管优势明显,但其局限性意味着不会完全取代传统开发,而是成为重要工具之一。
|
9月前
|
机器学习/深度学习 存储 人工智能
浅入浅出——生成式 AI
团队做 AI 助理,而我之前除了使用一些 AI 类产品,并没有大模型相关的积累。故先补齐一些基本概念,避免和团队同学沟通起来一头雾水。这篇文章是学习李宏毅老师《生成式 AI 导论》的学习笔记。
882 27
浅入浅出——生成式 AI
|
算法 小程序 JavaScript
【工具】我错了,这工具才是截图软件的神
本文介绍了一款名为Pixpin的强大截图工具,作者曾是Snipaste的忠实用户,但在尝试Pixpin后决定改换门庭。Pixpin不仅具备强大的截图功能,还支持文本识别、节点标注、长截图、颜色识别及贴图等功能,并且拥有活跃的社区反馈机制。文章详细讲解了Pixpin的各项特色功能及其使用方法,并提供了官方下载链接。通过实际操作演示,展示了Pixpin的便捷性和实用性。
1145 0
【工具】我错了,这工具才是截图软件的神
|
11月前
|
传感器 机器人 Android开发
卓伊凡怒揭真相:鸿蒙自研铁证如山,岂容无端抹黑?
卓伊凡怒揭真相:鸿蒙自研铁证如山,岂容无端抹黑?
236 16
卓伊凡怒揭真相:鸿蒙自研铁证如山,岂容无端抹黑?
|
人工智能 自然语言处理 算法
DeepSeek vs ChatGPT:AI对决中的赢家是……人类吗?
DeepSeek VS ChatGPT:DeepSeek以开源黑马姿态崛起,凭借低成本、高性能的「DeepSeek-V3」和专为深度推理设计的「DeepSeek-R1」,成为中小开发者的首选。而ChatGPT则较贵。 然而,AI依赖也带来隐忧,长期使用可能导致记忆衰退和“脑雾”现象。为此,推荐Neuriva解决方案,专注力提升30%,记忆留存率提升2.1倍,助力人类在AI时代保持脑力巅峰。 DeepSeek赢在技术普惠,ChatGPT胜于生态构建,人类的关键在于平衡AI与脑力健康,实现“双核驱动”突破极限!
1198 7
|
10月前
|
人工智能 自然语言处理 安全
Deepseek 的 “灵魂”,宇树的 “躯体”,智能机器人还缺一个 “万万不能”
法思诺创新探讨智能机器人产业的发展,指出Deepseek的AI“灵魂”与宇树的机器人“躯体”虽技术先进,但缺乏关键的商业模式。文章分析了两者在硬件和软件领域的困境,并提出通过软硬一体化结合及明确商业模式,才能实现真正实用的智能机器人。未来,需聚焦高频刚需场景、优化付费体验、推动技术创新,让智能机器人走进千家万户。法思诺提供相关课程与咨询服务,助力行业突破。
266 0
|
前端开发 JavaScript 开发者
前端项目代码规范工具 (ESLint. Prettier. Stylelint. TypeScript)
前端项目代码规范工具 (ESLint. Prettier. Stylelint. TypeScript)
883 4
|
设计模式 网络协议 Java
10.桥接模式设计思想
本文介绍了桥接模式的设计思想和实现方法。桥接模式通过将抽象部分与实现部分分离,使它们可以独立变化,解决了多层继承带来的复杂性和耦合性问题。文章详细讲解了桥接模式的由来、定义、应用场景和实现步骤,并通过具体实例演示了如何在支付场景中使用桥接模式。此外,还讨论了桥接模式的优缺点及其适用环境,提供了丰富的代码示例和进一步学习的资源链接。
410 2
|
人工智能 JavaScript 搜索推荐
2024 中国开发者调查报告出炉:通义灵码是开发者最常用的 AI 编码辅助工具
2024 中国开发者调查报告出炉:通义灵码是开发者最常用的 AI 编码辅助工具
1124 10