猜画小歌技术解密!推出一天 中国网民“疯”了

简介: 谷歌最近狠秀了一把存在感,前一刻还因安卓系统垄断事件被欧盟处以数十亿欧元的天价罚单,后一刻就凭借首款AI微信小程序“猜画小歌”占领了微信朋友圈。

看点:退出中国8年后,谷歌靠一款小程序再度挑动全中国网民。

谷歌最近狠秀了一把存在感,前一刻还因安卓系统垄断事件被欧盟处以数十亿欧元的天价罚单,后一刻就凭借首款AI微信小程序“猜画小歌”占领了微信朋友圈。“猜画小歌”是怎么做到20秒内就识别出各种“灵魂画作”?本文将揭秘它的前世今生和技术来源,原来早在2016年,谷歌就曾经试水过一众类似AI你画我猜的小游戏,而这些新奇有趣的AI应用背后,其实还与谷歌内部一个特殊的组织有着千丝万缕的关系。

这是谷歌退出中国市场八年后,在大陆首度推出第一款迷你小游戏,这款小游戏已经点燃中国网民参与的热情,成为新的现象级产品。没有大V加持,没有铺天盖地的硬广,谷歌官方微信公众号“谷歌黑板报”推送的一篇文章让朋友圈瞬间变成各种灵魂画手展示才艺的舞台。


image

“猜画小歌”使用神经网络技术,能在20s内识别各种或简易或潦草的手绘图,赋予了许多灵魂画手手绘的热情。在大家热情满满地晒画图闯关成绩的同时,也有声音怀疑谷歌是要借此收集大量免费的手绘数据来升级他们的AI系统。

引爆朋友圈的AI猜图小程序

“猜画小歌”是基于谷歌AI图像识别技术的绘图游戏。虽说类似于“你画我猜”,只不过涂鸦的人是你,和你合作的猜画人却变成了AI。给你一个物体名字(比如狗、鞋子、埃菲尔铁塔、蒙娜丽莎),让你20秒勾勒一幅简笔画,AI小程序就能猜出你画的什么东西。如果你的画作被AI成功猜出,就能顺利进入下一关;反之,游戏结束。如果连续多轮被猜中,你将有机会荣登排行榜高位。

除了识图功能之外,“猜画小歌”还配有接地气的语音功能,一旦开始放飞自我走“写意”路线,你就可能听到经典的谷歌女声“你画的啥玩意“、“我真的看不懂”等傲娇的吐槽。

小程序的游戏规则多少令人有些不解,由它指定名字让玩家画,它自己再来猜,这不是开外挂作弊吗?

于是,智东西进行了新的实验。分别在指定命题下画其它物体或直接写下文字。

image

结果证明,谷歌的AI真得挺乖,纯凭轮廓猜图,没有走“偷工减料”的捷径。

当你的画作被AI成功识别后,你就可以点击查看其它玩家的画作。果然微信藏匿着各种灵魂画手,在“长颈鹿”、“胳膊肘”、“骆驼”命题下充斥着各种迥异的画风。


image

许多玩家都产生了疑惑,为什么我都看不出来是什么东西,谷歌AI却能猜出来?这就要归功于AI系统使用的技术。

“猜画小歌”背后的技术

“猜画小歌”由来自Google AI的神经网络驱动,该神经网络源自全世界最大的、囊括了超过5000万个手绘素描的数据群,能在规定时间内识别玩家的粗略涂鸦。

神经网络(Neural Network, NN)是一门非常重要的机器学习技术,也是深度学习的基础。它是是一种模拟人脑神经网络结构和功能的数学模型或计算模型,用于估计和拟合函数,由神经元、参数和偏置项三个部分组成基本架构。

在人类看到物体时,会主动将物体归到某些类别。比如说看见一只金毛,大脑会根据中枢神经的指令,对外部刺激做出反应,从而判断出棕色、聪明、温顺等特征并意识到它是金毛。神经网络能做到的,就是让机器接近大脑去“思考”,通过大量积累表象数据,能够凭借直觉感知表象信息。

神经网络之父、深度学习鼻祖Geoffrey Hinton曾介绍道:“很多没有任何逻辑支持的知识都根深蒂固地存在我们的脑海之中。换成机器,情况也同样如此。知识都是来源于现实生活的,有大量案例和具体意义,因而神经网络的优点也就在于此。”

image

▲神经网络之父、深度学习鼻祖Geoffrey Hinton

神经网络在计算机视觉领域的应用尤为广泛。通过以大量的图像数据集对神经网络进行训练和优化,用神经网络识别图像中的物体已经不再是难题。比如在“猜画小歌”中,AI从大量的已被标注的手绘数据中学习到每个分类的核心特征,理解人们每一笔的下笔走势等细节。被训练好的AI系统从接收到的粗略轮廓中提取匹配的特征信息,从而识别出所画的物体。这一点在玩游戏的过程中也有体现,在画简单物体时,刚勾勒几笔,AI就能识别出来,而对于较复杂的物体,AI识别就需要花费更长的时间去判断。人类来说看不懂的神奇画风,对于见过5000万手绘图的AI而言或许只是小菜一碟。

虽说“猜画小歌”是让我们手绘让AI猜,但AI早已具备了自己画画的能力。基于和“猜画小歌”相同的谷歌Quick, Draw!数据集,去年Google Brain的科学家David Ha和Douglas Eck发布一种新型的循环神经网络(RNN),它不仅能识别人类画的物体,还可以学习自己画画。

image

这种被称为Sketch-RNN的RNN将从来自Quick, Draw!的大量被分类的人类手绘中收集全面的手绘信息,包括每一笔的顺序和方向,经过训练可以生成新的图画,还能补充人类没有完成的草图。


image

这种技术可以带来有趣的应用,例如帮助艺术家和平面设计师在他们的工作中提出更创新的想法,甚至可以教人绘图。

A.I.Experiments与谷歌创意实验室

其实“猜画小歌”并不是创新之举,早在2016年谷歌就已经推出了网页版猜画小游戏Quick, Draw!。Quick, Draw!则是在20s的时间内画出指定物体并让AI判断你画了什么。这次的小游戏更像是Quick, Draw!的封装在小程序的大陆本土化变种。刚发布不到六个月,Quick, Draw!就让全世界网民都沉浸其中。数百万玩家的涂鸦已经被陆续收录到手绘数据集中,并为正在开发的新神经网络训练提供样本。

Quick, Draw!来自谷歌在2016年11月上线的A.I.Experiments网站(网址:http://aiexperiments.withgoogle.com/)。A.I.Experiments由由谷歌创意实验室(Creative Lab)的程序员、设计师、创意师共同创建,旨在使用户通过趣味性体验和游戏轻松了解AI最新技术。无论你是专业算法工程师,还是刚入门的编程爱好者,都能在这个平台上轻松上手创建自己的AI实验。目前在这个项目网站上已经积累了上千个AI相关的产品,范围包括图像、声音、数据等许多方面。

去年谷歌已发布从Quick, Draw!获得的数据,向公众展示1500万人如何同时画一类物体。开发者可以用这些开源数据开展任何基于计算机视觉的AI项目。


image

谷歌创意实验室的创意师、负责独立游戏开发的Jane Friedhoff曾表示:“其中所有数据都在不断丰富我们的AI系统,为机器学习提供训练样本。”

谷歌创意实验室表示,A.I. Experiments不仅为广大用户提供了训练谷歌神经网络的平台,还是谷歌“以AI为核心”计划的有效实践方式,希望通过平等开放的平台和开诚布公的讨论,让人们通过体验对机器学习技术有更多的了解和更理智的思考。

体验乐趣or收集数据?

小程序页面显示,“猜画小歌”的开发主体为谷歌信息技术(中国)有限公司,被归为在校教育类别。谷歌表示,“猜画小歌”旨在让用户了解和体验AI的乐趣。

部分用户并不认同这种说法,他们以更为冷静警惕的态度看待这款AI小程序,认为它的推出是利用玩家的好奇心和求生欲为谷歌积累更多的免费手绘标注数据,或者说让用户在不知不觉中成为AI系统的“训练师”之一。

image

对于这一疑惑,这款小程序的开发者表示,其实是大家想多了。为了让AI能猜大家的画作,他们已经提前给AI模型喂了大量的数据,所以除非大家的画作能达到一定量级,否则不会对AI本身造成重大影响。

除了现有玩法外,“猜画小歌”对战功能、围观功能以及多人一起的群殴模式等更多的社交功能正在开发中,大家可以继续关注这款小程序的成长。

结语:AI小程序激起小浪花,谷歌或将踏浪而归

自2010年退出中国大陆市场,谷歌的大部分服务与应用程序都被关在大陆门外。来到中国,就要按中国的规矩办事,谷歌显然已经吸收了之前的教训。如今,谷歌的一些应用程序已经在陆续重登这片土地。去年,谷歌翻译安静复出。今年5月,谷歌与中国四家第三方应用商店合作,推出中国版Files Go设备管理应用程序,并将AR和VR开发套件交付予小米应用程序商店,

今年1月,谷歌宣布和腾讯达成专利许可协议,意图在中国市场进一步合作。上个月,谷歌还向中国第二大最有价值的电子商务公司京东投资5.5亿美元。

每天都有数亿活跃用户在使用微信服务,近日微信团队公布最新数据,微信小程序数量已经超过100万,每日人均打开次数4次,54%的打开次数都是用户主动打开。微信小程序的生态繁荣,为谷歌在中国提供了新的立足点,这意味着用户可以绕过Google Play和苹果的App Store接触到谷歌AI技术。

虽说“猜画小歌”小游戏的目标很低,但这将成为谷歌在微信扎根的第一步,未来很可能基于微信这个平台推出更重要的应用程序或服务。

不过随着越来越严格的审查制度和中国对美国科技公司审查的加强,谷歌的进一步扩张依然前路坎坷。

原文发布时间为:2018-07-19
本文来自云栖社区合作伙伴“智东西 ”,了解相关信息可以关注“智东西 ”。

相关文章
|
消息中间件 存储 大数据
一文读懂kafka的幂等生产者
一文读懂kafka的幂等生产者
|
存储 XML 安全
Jetpack DataStore 你总要了解一下吧?
一、DataStore 介绍 DataStore 是 Android Jetpack 中的一个组件,它是一个数据存储的解决方案,跟 SharedPreferences 一样,采用key-value形式存储。 DataStore 保证原子性,一致性,隔离性,持久性。尤其是,它解决了 SharedPreferences API 的设计缺陷。 Jetpack DataStore 是经过改进的新版数据存储解决方案,旨在取代 SharedPreferences,让应用能够以异步、事务方式存储数据。
1334 0
Jetpack DataStore 你总要了解一下吧?
|
4月前
|
人工智能 缓存 Java
[特殊字符] Spring AI 1.1 来了!Java 程序员的 AI 工具箱,这次直接「装满+扩容」!
Spring AI 1.1重磅发布:850+改进、354项新功能!五大亮点——MCP工具自动调用、Prompt缓存降本90%、自进化Agent、首发支持Gemini/ElevenLabs等多模态模型、安全增强型RAG。Java开发AI应用,更省、更快、更稳、更酷!
434 1
|
5月前
|
人工智能 安全 Shell
在 Moltbot (Clawdbot) 里配置调用阿里云百炼 API 完整教程
Moltbot(原Clawdbot)是一款开源AI个人助手,支持通过自然语言控制设备、处理自动化任务,兼容Qwen、Claude、GPT等主流大语言模型。若需在Moltbot中调用阿里云百炼提供的模型能力(如通义千问3系列),需完成API配置、环境变量设置、配置文件编辑等步骤。本文将严格遵循原教程逻辑,用通俗易懂的语言拆解完整流程,涵盖前置条件、安装部署、API获取、配置验证等核心环节,确保不改变原意且无营销表述。
4116 6
|
物联网 数据处理 C#
C#实现上位机开发,串口通信,读写串口数据并处理16进制数据
C#实现上位机开发,串口通信,读写串口数据并处理16进制数据。在自动化、物联网以及工业控制行业中,上位机开发是一项重要的技能。本教程主要介绍使用C#进行上位机开发,重点在于串口通信和数据处理。
2900 82
|
5G 网络架构 UED
网速只拼Mbps?解码网速真相的五大关键因素
Mbps(兆比特每秒)是衡量数据传输速度的单位,表示每秒传输的百万比特数。它是评估网络性能的核心指标,广泛应用于家用宽带、移动网络和企业级网络中。Mbps 数值越高,理论上数据传输越快,但实际体验还受网络拥塞、丢包率和信号强度等因素影响。例如,在网络高峰时段或信号较弱的地方,即使Mbps数值高,也可能出现卡顿。5G和光纤技术显著提升了Mbps速率,但仍需考虑硬件设备如路由器和网卡的性能瓶颈。理解Mbps及其影响因素,有助于用户选择合适的网络服务并优化网络体验。
1384 1
|
缓存 监控 持续交付
ThinkPHP6的控制器定义及控制器初使用
本文介绍了ThinkPHP6框架中控制器的定义和初步使用方法。内容包括控制器的文件位置、命名规范、如何改变控制器目录名、单应用模式下的项目访问路径,以及控制器类文件的实际位置和访问URL的示例。文章还提到了ThinkPHP的控制器类可以灵活定义,无需继承任何基础类库,但建议继承一个基础的控制器类以方便扩展。控制器名不区分大小写,并且支持驼峰命名转下划线的方式。
ThinkPHP6的控制器定义及控制器初使用
|
人工智能 决策智能
【AI Agent系列】【MetaGPT多智能体学习】6. 多智能体实战 - 基于MetaGPT实现游戏【你说我猜】(附完整代码)
【AI Agent系列】【MetaGPT多智能体学习】6. 多智能体实战 - 基于MetaGPT实现游戏【你说我猜】(附完整代码)
947 0