开发者社区> 技术小能手> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

报告老板!这个阿里程序员每天上班就看别人接吻

简介:
+关注继续查看

我叫吉恒杉,29岁,是一名“吻戏鉴定师”。

和女朋友刚谈恋爱的时候,我说我的工作是训练计算机识别出吻戏镜头。她听完觉得特别不可思议,谁能给钱让你干这个呢?

如果你用手机、电脑看过视频,一定感受过进度条上的情节提示,可以迅速找到自己想看的明星或情节。

没错,这些就是我们干的!

0fb9a6f66ba6b3b6a5d3a86a53a8c481ac8a2b96

正经的,在优酷我们的岗位叫人工智能标注员。我每天训练机器识别“接吻”镜头,然后将成百上千幅内容各异的画面标注成两类——“接吻”和“非接吻”。“吻戏鉴定师”是同事们的戏称,但说实话,我挺喜欢。

选择这个工作,一开始是因为和我的硕士专业计算机视觉刚好吻合。通俗地讲,就是“教电脑看懂世界”。现在我每天教电脑看懂“什么是接吻”,可以说,契合度百分百了。当然,这个工作既给大家带来快乐和幸福,又能以工作的名义看网剧(哈哈哈哈哈……这个可能是重点),最爱《军师联盟》,吴秀波铁粉。

8cce2f03e544081571796e5935fd565628a9e3f4

做一名合格的人工智能标注员其实也不那么容易。身边越来越多的人用手机和电脑看视频,大家不仅是简单地看剧,还想看更精彩有趣的片段、集锦,更主动地找到自己最想看的明星或者场景。

要想实现搜索和智能编辑,还真需要不少“人工”。要给成百上千幅吻戏画面打上标签,先要探讨什么样的画面算是吻戏,制作模型应该怎么画,然后训练机器人识别什么场景是“接吻”,通过数次的技术调试,让机器人自动从海量视频中,迅速抓取场景。

8f6566b4d8761a8360d6fdff64803097956c82f4

因此如何教机器识别接吻成了首要的难题。我们要从图片库和视频中截出数千幅图片,从中一张一张标注出“接吻”的画面。这个过程叫做“数据标注”。

我们一天要标注几百张接吻的图像,最多时标注上千张,盯着电脑屏幕看一天,最后都有点麻木了。通常数据标注得越准确、数量越多,模型的效果就越好。自然,机器识别的效果就会更好。

b53820b7af009d28a8a21b574e805837034cb0d4

但是机器毕竟不是人,对有些复杂情况也无法识别。比如,有的接吻深情对视,而有的若即若离,团队里的伙伴们不得不打印出角度各异的“接吻”画面贴在墙上,一群人激烈讨论到底怎么才算“接吻”。

“吻戏鉴定”还需要根据机器的反应进行繁琐的后期调试。机器学习上千幅图片中的特征,然后再给机器一张“接吻”的画面,它就能认出来了。

目前,我们团队已经为2万多条吻戏打上了标签,一条5分钟的视频处理可在10秒内完成。比如《三生三世十里桃花》,每集50分钟的视频被切割成3000帧图片,机器只需要5秒就能挑出来杨幂和赵又廷的吻戏。

765ffbcef002c47a56ef1b248127e0b7e2016388

现在我和团队的小伙伴们还开始接触和研究其他场景,比如哭戏、打戏,接下来还要鉴定体育比赛中的射门、扑球、投篮、庆祝等画面,这样观众看视频时能很方便的去找到自己想看的情节。

当然在做标注的时候并不是每次都能成功,往往会因为一些小的差别,导致失败,重新再来。这就要求我们不光要看图片,还要时常“探班”,到比赛或节目现场去观察和体会每个场景、动作的细小差别。

aaa2d748db569ab4a39ad4e99ab8f0dacace466c

我们就想用自己的一点点努力,让你们看剧的时候,更爽一些。

好了,不说了,我要去训练机器识别古力娜扎和迪丽热巴了。


原文发布时间为:2018-08-9

本文作者:橙子

本文来自云栖社区合作伙伴“阿里味儿”,了解相关信息可以关注“阿里味儿”。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
LeetCode(算法)- 426. 将二叉搜索树转化为排序的双向链表
LeetCode(算法)- 426. 将二叉搜索树转化为排序的双向链表
15 0
NowCoder刷题(1)【树】二叉树的遍历(含图解)
NowCoder刷题(1)【树】二叉树的遍历(含图解)
17 0
【刷穿 LeetCode】881. 救生艇 : 归纳法证明贪心解为最优解之一
【刷穿 LeetCode】881. 救生艇 : 归纳法证明贪心解为最优解之一
19 0
掌门教育微服务体系 Solar | 阿里巴巴 Nacos 企业级落地中篇
在高速发展的时候,公司规模越来越大,老师人数越来越多,这时候公司不能铺太多人去做运营与服务,必须提高每个人效,这就需要技术驱动。因此掌门教育转变成一家技术驱动型的公司,如果被迫成为一家靠资金驱动的公司就活不下去了。-- 张翼(掌门教育创始人兼 CEO)
625 0
知乎高赞:985计算机视觉毕业后找不到工作怎么办?怒刷leetcode,还是另寻他路?
985 研究生,学计算机视觉,出来后找不到工作?本文带你看看这个 70 万浏览量问题下的答案干货:真正的人才什么时候都紧缺,搞扎实自己的基本功比什么都重要。心态放平,好好刷 leetcode,好 offer 总在不远处。
3762 0
阿里五年晋升三次,这个程序员要聊聊他的选择
小二穆远是蚂蚁金服的一名程序员,五年晋升了三次,他要聊聊自己的五年阿里之旅,那些变化、坚持和泪水。请看本期的年陈故事会。
2193 0
一周AI事件速览丨施尧耘人阿里量子首席科学家,各家AI大牛变动频繁
本周值得关注的事件:①施尧耘任阿里云量子技术首席科学家;②通用发布首款无人驾驶汽车;③京东组建智能音频联盟;④百度硅谷AI实验室主任离职;⑤诺亚方舟实验室主任将加盟头条;⑥Facebook建立第四个AI实验室。
1655 0
《Java语言程序设计》大作业报告 九宫格游戏
                《Java语言程序设计》大作业报告     中国石油大学(北京)2015 — 2016 学年第二学期     班级:_____计算机14-1_______ 姓名:_____  许 恺_________________ 学号:______2014011329___________       题意分析 程序首先需要九个可以移动的格子,大小相等,有字符串标示,其次要可以相应鼠标和键盘方向键的控制,可以自由移动,并且与此同时记录步数,最后在满足条件时弹出对话框并显示步数以及是否打破记录,关于打破记录还需要文件的操作。
1200 0
+关注
技术小能手
云栖运营小编~
7194
文章
9
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载