广告界的“奥斯卡”上,出现了中国的AI。
6月20日,戛纳国际创意节上出现了一款AI智能文案产品,可以根据商品自动生成文案,并且文案品质与人写文案已经并无二致。
质量有多高?
下图是AI文案与人工文案的对比:
对比发现,AI在词语押韵、联想延伸、意境创造等方面更胜一筹。
怎么做到的?
这款文案生成神器是阿里妈妈海棠创意中心在戛纳国际创意节上发布的一款AI智能文案产品,结合淘宝、天猫的海量优质内容与自然语言算法,主要聚焦于商品文案,已经实现了三项核心能力——高度模拟人写文案、自由定义字数、实时在线样本学习。
高度模拟人写文案:顺利通过图灵测试
阿里妈妈AI智能文案早已突破傻瓜式的机器模式,提供多种文案写作风格:描述型、特价型、实功效型、逗趣型、古诗词型等八种类型,风格类型也在不断扩充中。
生产出来的文案品质与人写文案已经并无二致,顺利通过了图灵测试。
模拟人写文案最重要是数据训练的问题,训练数据的质量直接决定了模型效果的好坏。目前阿里妈妈可以拿到的文案规模大约上亿,这些数据质量参差不齐。通过人工+机器半自动的清洗,得到高质量的训练数据达到数百万级,几乎覆盖了淘内所有类目和商品。
自由定义字数:对同一商品产出不同长度文案
由于阿里妈妈AI智能文案的主要聚焦点是商品文案,因此在功能上也做了针对性的突破,解决日常商家针对同一商品产出不同长度文案的问题。
通过对位置信息进行编码,改变每个词生成时的概率分布,实现长度可控。
无论是几个字的短标题,还是60字左右的商品描述,都可以一键生成。以最基础的短标题文案来举例,阿里妈妈AI智能文案的生产能力已达到1秒20000条。
实时在线样本学习:优质内容成为“养分”
作为一项深度学习逻辑下的产品,阿里妈妈AI智能文案保持实时在线学习,通过不断增加的优秀文案样本量,来提升自身的文案产出能力,满足用户的需求。
在这一点上,阿里妈妈AI智能文案优势尽显,其学习的样本来自于淘宝、天猫的多个优质内容渠道,同时,整个集团内容化的趋势已十分明显,来自达人和商家的海量优质内容成为源源不断的养分,经过机器学习,再转化成为优秀的文案产出,赋能商家,形成良性循环。
智能文案服务于商家/运营,同时商家/运营的选择结果会回流。目前该数据被用来训练一个二分类的质量控制模型,类似对抗生成网络里的判别器,来对智能文案生成网络的结果进行二分类判别。这个质量控制模型本质上是在拟合人对生成结果的判断。随着数据的不断积累,质量控制模型对结果的判断会更加准确,同时可以更好的指导生成网络的迭代。
另外,对于硬件要求,基于深度神经网络,目前智能文案服务部署在一个上百块卡的GPU集群上,提供离/在线一体化的文案解决方案。同时,软件方面,我们的服务建立在阿里妈妈创意中心之上,由智能创意服务SCS提供统一的在线文案生成服务。
把创意像公式一样“推导”出来,让“创新”稳定的发生。今后,一部分的文案工作可以交给AI来完成了。
原文发布时间为:2018-06-21
本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。