报告老板!这个阿里程序员每天上班就看别人接吻

简介:

我叫吉恒杉,29岁,是一名“吻戏鉴定师”。

和女朋友刚谈恋爱的时候,我说我的工作是训练计算机识别出吻戏镜头。她听完觉得特别不可思议,谁能给钱让你干这个呢?

如果你用手机、电脑看过视频,一定感受过进度条上的情节提示,可以迅速找到自己想看的明星或情节。

没错,这些就是我们干的!

0fb9a6f66ba6b3b6a5d3a86a53a8c481ac8a2b96

正经的,在优酷我们的岗位叫人工智能标注员。我每天训练机器识别“接吻”镜头,然后将成百上千幅内容各异的画面标注成两类——“接吻”和“非接吻”。“吻戏鉴定师”是同事们的戏称,但说实话,我挺喜欢。

选择这个工作,一开始是因为和我的硕士专业计算机视觉刚好吻合。通俗地讲,就是“教电脑看懂世界”。现在我每天教电脑看懂“什么是接吻”,可以说,契合度百分百了。当然,这个工作既给大家带来快乐和幸福,又能以工作的名义看网剧(哈哈哈哈哈……这个可能是重点),最爱《军师联盟》,吴秀波铁粉。

8cce2f03e544081571796e5935fd565628a9e3f4

做一名合格的人工智能标注员其实也不那么容易。身边越来越多的人用手机和电脑看视频,大家不仅是简单地看剧,还想看更精彩有趣的片段、集锦,更主动地找到自己最想看的明星或者场景。

要想实现搜索和智能编辑,还真需要不少“人工”。要给成百上千幅吻戏画面打上标签,先要探讨什么样的画面算是吻戏,制作模型应该怎么画,然后训练机器人识别什么场景是“接吻”,通过数次的技术调试,让机器人自动从海量视频中,迅速抓取场景。

8f6566b4d8761a8360d6fdff64803097956c82f4

因此如何教机器识别接吻成了首要的难题。我们要从图片库和视频中截出数千幅图片,从中一张一张标注出“接吻”的画面。这个过程叫做“数据标注”。

我们一天要标注几百张接吻的图像,最多时标注上千张,盯着电脑屏幕看一天,最后都有点麻木了。通常数据标注得越准确、数量越多,模型的效果就越好。自然,机器识别的效果就会更好。

b53820b7af009d28a8a21b574e805837034cb0d4

但是机器毕竟不是人,对有些复杂情况也无法识别。比如,有的接吻深情对视,而有的若即若离,团队里的伙伴们不得不打印出角度各异的“接吻”画面贴在墙上,一群人激烈讨论到底怎么才算“接吻”。

“吻戏鉴定”还需要根据机器的反应进行繁琐的后期调试。机器学习上千幅图片中的特征,然后再给机器一张“接吻”的画面,它就能认出来了。

目前,我们团队已经为2万多条吻戏打上了标签,一条5分钟的视频处理可在10秒内完成。比如《三生三世十里桃花》,每集50分钟的视频被切割成3000帧图片,机器只需要5秒就能挑出来杨幂和赵又廷的吻戏。

765ffbcef002c47a56ef1b248127e0b7e2016388

现在我和团队的小伙伴们还开始接触和研究其他场景,比如哭戏、打戏,接下来还要鉴定体育比赛中的射门、扑球、投篮、庆祝等画面,这样观众看视频时能很方便的去找到自己想看的情节。

当然在做标注的时候并不是每次都能成功,往往会因为一些小的差别,导致失败,重新再来。这就要求我们不光要看图片,还要时常“探班”,到比赛或节目现场去观察和体会每个场景、动作的细小差别。

aaa2d748db569ab4a39ad4e99ab8f0dacace466c

我们就想用自己的一点点努力,让你们看剧的时候,更爽一些。

好了,不说了,我要去训练机器识别古力娜扎和迪丽热巴了。


原文发布时间为:2018-08-9

本文作者:橙子

本文来自云栖社区合作伙伴“阿里味儿”,了解相关信息可以关注“阿里味儿”。

相关文章
|
数据可视化 API 数据库
低代码/无代码运动:软件开发的未来还是乌托邦?
低代码/无代码(LCNC)平台近年来在软件开发领域引起广泛关注,通过简化界面和预构建模块,使非技术用户也能快速构建应用。本文探讨其潜在影响、优势与挑战,以及对传统开发的影响。核心优势包括快速开发、易于使用和成本效益;主要挑战则涉及定制化限制、性能问题和技术锁定。LCNC平台促使开发者角色转变,促进业务与IT融合,并加速创新。尽管优势明显,但其局限性意味着不会完全取代传统开发,而是成为重要工具之一。
|
监控 前端开发 数据挖掘
微店商品详情数据接口:接入淘宝代购系统的连接桥梁,展示前端页面
微店API让开发者获取商品详尽信息,如名称、价格等。作为淘宝代购系统的桥梁,它支持数据同步、商品及订单管理。通过多平台API,实现实时商品数据抓取,提供一致购物流程。此外,还能进行价格比较、库存监控,提升用户交互体验,并辅助数据分析以优化采购策略。开发者需按规范对接API,并参考官方文档获取最新信息。
|
算法 小程序 JavaScript
【工具】我错了,这工具才是截图软件的神
本文介绍了一款名为Pixpin的强大截图工具,作者曾是Snipaste的忠实用户,但在尝试Pixpin后决定改换门庭。Pixpin不仅具备强大的截图功能,还支持文本识别、节点标注、长截图、颜色识别及贴图等功能,并且拥有活跃的社区反馈机制。文章详细讲解了Pixpin的各项特色功能及其使用方法,并提供了官方下载链接。通过实际操作演示,展示了Pixpin的便捷性和实用性。
780 0
【工具】我错了,这工具才是截图软件的神
|
11月前
|
前端开发 JavaScript 开发者
前端项目代码规范工具 (ESLint. Prettier. Stylelint. TypeScript)
前端项目代码规范工具 (ESLint. Prettier. Stylelint. TypeScript)
658 4
|
11月前
|
数据采集 DataWorks 搜索推荐
DataWorks产品评测:数据处理最佳实践与平台体验
DataWorks产品评测:数据处理最佳实践与平台体验
215 8
|
7月前
|
人工智能 自然语言处理 安全
Deepseek 的 “灵魂”,宇树的 “躯体”,智能机器人还缺一个 “万万不能”
法思诺创新探讨智能机器人产业的发展,指出Deepseek的AI“灵魂”与宇树的机器人“躯体”虽技术先进,但缺乏关键的商业模式。文章分析了两者在硬件和软件领域的困境,并提出通过软硬一体化结合及明确商业模式,才能实现真正实用的智能机器人。未来,需聚焦高频刚需场景、优化付费体验、推动技术创新,让智能机器人走进千家万户。法思诺提供相关课程与咨询服务,助力行业突破。
189 0
|
设计模式 网络协议 Java
10.桥接模式设计思想
本文介绍了桥接模式的设计思想和实现方法。桥接模式通过将抽象部分与实现部分分离,使它们可以独立变化,解决了多层继承带来的复杂性和耦合性问题。文章详细讲解了桥接模式的由来、定义、应用场景和实现步骤,并通过具体实例演示了如何在支付场景中使用桥接模式。此外,还讨论了桥接模式的优缺点及其适用环境,提供了丰富的代码示例和进一步学习的资源链接。
338 2
|
关系型数据库 中间件 数据库连接
drds读写分离与只读实例
drds读写分离与只读实例
317 3
详尽分享蒙提霍尔悖论(三门问题)终极分析
详尽分享蒙提霍尔悖论(三门问题)终极分析
441 0