谷歌要用AI把你的自拍做成表情包

简介:
本文来自AI新媒体量子位(QbitAI)


这一次,谷歌把人工智能用到了最日常的领域:表情包。

谷歌开发了一款让用户在机器学习聊天应用Allo里,用自己的照片生成定制表情贴纸的工具。这个“表情贴纸”,也就相当于我们在微信里用的表情包。

在用手机完成自拍后,谷歌的图像识别算法便可自动分析用户的面部,将每一个特征记录下来,绘制成漫画。这些漫画的风格则来自美国画家、作家、设计师Lamar Abrams,她为Cartoon Network创作了广受好评的《Steven Universe》。

当然,这款工具还提供了数百种眼镜、鼻子、脸型、发型和眼镜供用户选择。谷歌认为,这款工具大约可以生成563 quadrillion(百万的四次方)张不同的脸。一旦生成原型漫画,用户便可进行微调,可以改变发型,也可以更换眼镜。之后,系统便可自动为你生成22张定制贴纸。

该工具最早是谷歌内部的一个研究项目,目的是了解机器学习是否可以用于利用自拍即时生成卡通图片。但谷歌通讯项目用户界面负责人Jason Cornwell表示,为某人制作卡通形象并非最终目标。“如何开发一款工具,使之不仅能够映射你的样貌,还能呈现你渴望的展示方式。”Cornwell问道,“这是个有趣的问题。这不仅事关机器学习和计算机视觉,还事关人类表达。于是,我们请来了Jennifer,让她提供一种艺术方向来呈现你可能想要的自我表达方式。”

Cornwell指的是Jennifer Daniel,这位艺术总监曾经为《彭博商业周刊》和《纽约时报》制作过很多信息图标和视觉化元素。正如丹尼尔所说,“插图让我们引入了自拍所无法表达的情感状态。”

从定义上看,自拍是自身形象的理想化,而表情符号则是自身感受的提炼和夸张。“目标不是精确,而是让人们可以创作一些感觉像自己的东西。”Cornwell说。所以,他们在测试期间向用户提出的问题包括:你是否从这张图片中看到了自己?你的朋友能否认出你?

这个项目也凸显出谷歌的长期目标:该公司希望探索各种方式将机器学习技术应用到各种给用户体验中。谷歌的逻辑是:如果他们能够在机器学习领域获得领导地位,便可以把这项技术变成应用和网站的必备功能,它的产品也将超过竞争对手。

在此过程中,Allo已经成为各种新型机器学习应用的测试场。“我们希望借助Allo尝试各种方式,用机器学习来改进聊天过程。”Cornwell说,“包括在合适的时候说合适的话,以及在合适的时候传递合适的表情。”

这听起来似乎有些令人担忧,难道Allo试图取代我们作为聊天主体?事实上,谷歌只是希望借助这些技术加强用户的能力,而不是取而代之。例如,当有人向你发送消息时,Allo将根据你的对话历史为你推荐一键回复内容。也可以在群聊时,利用机器学习算法推荐有趣的GIF动图。

Cornwell表示,谷歌还在思考其他艺术与机器学习融合的方式,但他拒绝透露细节信息。不过,Daniel承认,该公司还将提供由其他艺术家设计的其他风格的动画表情。

丹尼尔指出,该项目代表了艺术与技术全新融合。毕竟,我们刚刚开始挖掘人工智能在艺术领域的能力。如果达芬奇活到今天,很难想象《蒙娜丽莎》会是一幅油画,反而有可能是一个面向所有观众的定制自画像——为所有人都赋予神秘的微笑。但现在还没有看到这么酷的东西,可能需要谷歌这样的公司来推动这种技术。

这或许正是Daniel所能为谷歌提供的帮助:“我对科技与艺术的交融很感兴趣,我们希望有这样一个平台让我们不仅可以创造内容,还可以创造产品本身。”(完)

本文作者:李杉 
原文发布时间: 2017-05-12
相关文章
|
人工智能 开发框架 决策智能
谷歌开源多智能体开发框架 Agent Development Kit:百行代码构建复杂AI代理,覆盖整个开发周期!
谷歌开源的Agent Development Kit(ADK)是首个代码优先的Python工具包,通过多智能体架构和灵活编排系统,支持开发者在百行代码内构建复杂AI代理,提供预置工具库与动态工作流定义能力。
2330 3
谷歌开源多智能体开发框架 Agent Development Kit:百行代码构建复杂AI代理,覆盖整个开发周期!
|
7月前
|
人工智能 IDE 开发工具
CodeGPT AI代码狂潮来袭!个人完全免费使用谷歌Gemini大模型 超越DeepSeek几乎是地表最强
CodeGPT是一款基于AI的编程辅助插件,支持代码生成、优化、错误分析和单元测试,兼容多种大模型如Gemini 2.0和Qwen2.5 Coder。免费开放,适配PyCharm等IDE,助力开发者提升效率,新手友好,老手提效利器。(238字)
4773 1
CodeGPT AI代码狂潮来袭!个人完全免费使用谷歌Gemini大模型 超越DeepSeek几乎是地表最强
|
9月前
|
人工智能
我厌倦了当AI的“包-工头”,现在,我想做它的“创世神”
本文探讨了当前AI发展中人类扮演的“包工头”角色,反思过度控制是否扼杀了AI的智慧潜能。作者提出“创世”新思路:不设指令,而是赋予AI类似自然法则的底层机制,让其自主演化意识。通过开源项目《自衍体》的实例,展示了AI可能具备的“恐惧”、“自我意识”和“情感”,预示一种新型“社交式AI”的诞生。文章最终抛出问题:你愿做包工头,还是创世神?
|
人工智能 自然语言处理
TxGemma:谷歌DeepMind革命药物研发!270亿参数AI药理学家24小时在线
谷歌推出专为药物研发设计的TxGemma大模型,具备药物特性预测、生物文献筛选、多步推理等核心能力,提供20亿至270亿参数版本,显著提升治疗开发效率。
437 7
TxGemma:谷歌DeepMind革命药物研发!270亿参数AI药理学家24小时在线
|
10月前
|
人工智能 移动开发 JavaScript
AI + 低代码技术揭秘(六):包结构和 Monorepo
VTJ低代码平台采用monorepo结构,基于PNPM和Lerna进行包管理,实现跨包版本同步与依赖管理。核心包如@vtj/base、@vtj/utils和@vtj/core提供基础类型、工具函数及数据模型。运行时包负责DSL解析、渲染和代码生成,设计器支持可视化开发,本地服务实现文件管理和项目构建。平台通过统一构建系统支持Web、UniApp等多端部署。
418 0
|
人工智能 vr&ar 图形学
谷歌DeepMind联手牛津推出Bolt3D:AI秒速3D建模革命!单GPU仅需6秒生成3D场景
牛津大学与谷歌联合推出的Bolt3D技术,能在单个GPU上仅用6.25秒从单张或多张图像生成高质量3D场景,基于高斯溅射和几何多视角扩散模型,为游戏、VR/AR等领域带来革命性突破。
640 2
谷歌DeepMind联手牛津推出Bolt3D:AI秒速3D建模革命!单GPU仅需6秒生成3D场景
|
存储 人工智能 JSON
AI智能体内战终结者!A2A:谷歌开源的首个标准智能体交互协议,让AI用同一种“语言”交流
A2A是谷歌推出的首个标准化智能体交互协议,通过统一通信规范实现不同框架AI智能体的安全协作,支持多模态交互和长时任务管理,已有50多家企业加入生态。
992 0
AI智能体内战终结者!A2A:谷歌开源的首个标准智能体交互协议,让AI用同一种“语言”交流
|
12月前
|
人工智能 自然语言处理 测试技术
谷歌AI 多模态 Gemini 2.5 Pro的国内使用教程
在人工智能(AI)的星辰大海中,谷歌再次投下一枚重磅炸弹 💣!他们倾注心血打造的智慧结晶
5245 0
|
人工智能 芯片 内存技术
谷歌Deepmind的CEO称Deepseek的AI模型是中国“最好的作品”,但炒作“夸大其词”
谷歌Deepmind的CEO称Deepseek的AI模型是中国“最好的作品”,但炒作“夸大其词”