最近,雷锋网宅客频道(微信公众号:letshome)看到外媒报道了一则让人惊讶的消息:世界最大黄网 Pornhub 要用 AI 自动识别成人片内容和演员,还号称要让鉴黄师下岗。
到底怎么回事?我们来看看新闻稿:
Pornhub已经宣布推出一款全新的成人片识别引擎,这款引擎由 AI 驱动,使用计算机视觉技术自主检测和识别成人片内容以及表演者,将让那些负责监视和标记无数小时色情影片的工作人员失业。
该引擎和算法迄今为止通过简单的扫描和解释镜头进行了训练,以识别超过 1 万种色情内容。 Pornhub表示使用了数千个视频以及演员的官方照片来训练这个 AI 驱动的解决方案。
原来,首先是对视频进行识别,然后打标签。机智的读者想必还看到了重点:可以识别超过1万种色情内容,用演员的照片和视频来训练。
1万种色情内容?编辑突然不懂了。
原来,这款 AI 引擎可以识别不同的开车场景:室内、室外,是不是金发妹子,以及开车的不同姿势。
为什么一个黄网要“鉴黄”?
人家副总裁Corey Price 说了:“最终,我们想要给粉丝提供他们喜欢的所有一切。我们的新模式能提供更准确的结果,希望这可以让他们更多地访问我们的网站。浏览和访问想看的内容越容易,他们的愉悦感就会越高。”
说白了,无非就是现在大家都很熟悉的“内容推荐”和“用户体验”,准确地帮用户搜索想要的内容,这种类型的搜索推荐技术某头条和某宝都在使用。
事实上,现在有很多企业在使用 AI 引擎进行图片、视频甚至是直播视频识别,打标签。此前雷锋网(公众号:雷锋网)就报道过:《为了找出羞羞视频,百度云居然有“娇喘模式”》《从“鉴黄”到视频&直播个性化推荐,图普科技不仅要帮人省钱还要帮人赚钱》等。
不过,雷锋网发现,Pornhub 称,用户现在可以搜索有亲和力的特定色情明星,这个 AI 模型将能够获得更准确的结果,因为每天有超过 10000 个视频被添加到 Pornhub 中可以对 AI 模型进行训练。而在此前的报道中,有些公司的训练建立在千万级的基础上。Pornhub 10000 个视频能保证精准度吗?
图普科技运营总监姜泽荣认为,如果按照一个视频 1.5 小时来看,一秒一张图截图,在上述数量视频的基础上,也算挺多的,能训练出效果尚可的模型。但是,仅对色情类视频鉴别产生效果,换到其他类型的数据效果就不好了。
意思是,Pornhub 要想利用这个引擎跨行干点副业,估计就不好使了。
为了提升精确度,Pornhub 网站要求用户验证 AI 模型提供的标签是否正确。看来,Pornhub 已经机智地将通常净网行动中人工抽检复核的这一环节转推到用户身上,进一步省略了自己的“人工”环节。
毕竟,Pornhub 打出的口号是:希望人工智能可以简化业务运营,让许多流程自动化,从而不必过多地依赖人工。
姜泽荣还称,比起 Pornhub 宣称的各种场景识别,其实国内早就能做到,比如图普科技可以识别视频中的卧室是否有床,识别头发颜色,甚至还可以识别是长发还是短发。
一个关键问题来了,黄网这么努力地提升技术做内容推荐,会与净网行动的“扫黄”中的“鉴黄”技术产生对抗吗?
姜泽荣表示:“对于鉴黄模型来说,只要是它学习过的数据类型,大部分都能识别,除非色情网站不断弄新的色情类型,或者专门找鉴黄模型可能识别不准的类型来发布,不然他们的内容依然还是会识别出来,而且鉴黄模型本身也是在优化升级的,会不断对数据库进行学习,提高识别率。”