谷歌开源“教机器画画”项目代码,公开5000万幅简笔画数据集

简介:
本文来自AI新媒体量子位(QbitAI)

这个小游戏,你大概还有点印象。机器给出一个名词,给你20秒时间画画,同时,它会根据你画的东西一直猜猜猜。

游戏的名字,叫“Quick, Draw!”。

今天,谷歌开放了Quick, Draw!数据集,包含345类、5000万幅简笔画。这些简笔画,来自这个小游戏的1500万用户。

数据集的GitHub地址:
https://github.com/googlecreativelab/quickdraw-dataset

与通常的图像数据集不同,谷歌捕捉了这些简笔画的绘制过程,存储成为一组带时间戳的向量,并加上了元数据信息标签,包括机器要求用户画的是什么、用户所在国家等。

机器成功认出的图像,也就是被收录到数据集中的那些,都展示在Quick, Draw!的数据集网站上:https://quickdraw.withgoogle.com/data

 Quick, Draw!游戏玩家画的苹果

谷歌希望开发者、研究人员和艺术家,能用这些数据来进行研究、探索。他们说,这些简笔画构成了一个独特的数据集,开发者可以用它来训练新的神经网络,研究人员可以借助它探索世界各地人民画画的模式,艺术家则可能从中获得灵感,创造我们从未想过的东西。

如果你用这个数据集创造了什么东西,谷歌希望你通过邮件告诉他们,或者去A.I. Experiments网站提交。

邮箱:quickdraw-support@google.com
网站:https://aiexperiments.withgoogle.com/submit

上个月,谷歌用这个数据集完成了一个教机器画画的项目:Sketch-RNN。在这个项目中,机器不仅学会了画简笔画,还对自己所画的东西建立了抽象概念,比如说知道猫应该有两只眼睛,猪有四条腿。

谷歌大脑团队研究员David Ha和Douglas Eck发表了论文《A Neural Representation of Sketch Drawings》来详细阐释这个项目,并在谷歌官方博客上发文做了通俗说明。

在Quick, Draw!数据集开放之后,Sketch-RNN模型也在谷歌的艺术项目Magenta下开源。谷歌开放了Sketch-RNN的预训练模型、供你在TensorFlow中训练自己模型用的源代码、以及一份Jupyter notebook教程。

最后,这里还有一个Douglas Eck发布的视频,展示了Sketch-RNN生成的瑜伽过程:


10秒左右,模型为画面中的人,加了个瑜伽垫,你会看到机器懵了一会儿。具体原因,作者在项目相关论文中做出了解释。

Sketch-RNN开源模型:
https://github.com/tensorflow/magenta/tree/master/magenta/models/sketch_rnn
A Neural Representation of Sketch Drawings论文:
https://arxiv.org/abs/1704.03477

【完】

本文作者:李林 
原文发布时间: 2017-05-19
相关文章
|
7月前
|
编解码 自然语言处理 开发者
复刻Sora有多难?一张图带你读懂Sora的技术路径
OpenAI发布了视频生成模型Sora,最大的Sora模型能够生成一分钟的高保真视频。同时OpenAI称,可扩展的视频生成模型,是构建物理世界通用模拟器的一条可能的路径。
|
机器学习/深度学习 人工智能 Linux
AI让照片换发型,Barbershop开源项目安装使用 | 机器学习
AI让照片换发型,Barbershop开源项目安装使用 | 机器学习
AI让照片换发型,Barbershop开源项目安装使用 | 机器学习
|
7月前
|
自然语言处理 数据可视化 算法
【传知代码】私人订制词云图-论文复现
本文介绍了词云图的原理和生成步骤,包括分词、统计词频、去除停用词等,并提供了Python实现示例,利用`wordcloud`和`jieba`库。此外,还分享了技巧,如处理中文乱码、选择背景图、词库转换及自定义文字颜色。词云图能直观展示文本关键信息,适用于数据分析和文本挖掘,但也有其局限性,如无法显示词汇的语法关系。源码和更多资源可在文章附件获取。
【传知代码】私人订制词云图-论文复现
|
机器学习/深度学习 自然语言处理 测试技术
社区供稿 | 封神榜团队揭秘大模型训练秘密:以数据为中心
近一年来,各种各样的开源和闭源的大语言模型,不断在多个中文英文的测试基准中刷新着记录。然而,大语言模型的开发仍然面临诸多挑战,比如从头开始训练大语言模型的高昂成本,以及继续预训练导致的灾难性遗忘等等。尽管许多研究致力于解决这些问题,但一个重要而且实际的限制是,许多研究过于追求扩大模型规模,没有全面分析和优化预训练数据在训练大语言模型过程中的使用。
|
7月前
|
人工智能 算法 开发者
苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相
【5月更文挑战第9天】苹果开源大语言模型OpenELM,提升效率和准确性,参数仅为10亿时比OLMo准确度高2.36%。苹果首次公开训练全过程、权重、数据集和代码,增强研究透明度,支持在苹果设备上推理和微调,推动AI研究发展。但训练资源需求高和模型可解释性仍是挑战。论文链接:[arxiv.org/pdf/2404.14619.pdf](https://arxiv.org/pdf/2404.14619.pdf)
78 3
|
人工智能 算法 JavaScript
既Facebook道歉AI误将黑人标记为灵长类动物后,推荐GitHub 上 7 个 yyds 算法项目
既Facebook道歉AI误将黑人标记为灵长类动物后,推荐GitHub 上 7 个 yyds 算法项目
129 1
既Facebook道歉AI误将黑人标记为灵长类动物后,推荐GitHub 上 7 个 yyds 算法项目
|
人工智能 JSON 前端开发
Star量近8万,大火AutoGPT星标超PyTorch,网友:看清它的局限性
Star量近8万,大火AutoGPT星标超PyTorch,网友:看清它的局限性
|
人工智能 JSON 前端开发
大火AutoGPT星标超PyTorch,网友:看清它的局限性
大火AutoGPT星标超PyTorch,网友:看清它的局限性
|
机器学习/深度学习 计算机视觉
英伟达的实习生提出零样本风格迁移:多模态CLIP玩出花,只用文本就能干CV的活!
零样本的风格迁移听说过没有?英伟达一个实习生小哥集文本CLIP和图像生成StyleGAN于一身,只需要输入几个单词就可以完成你想要的风格迁移效果!再也不用为了风格迁移找数据啦!
298 0
英伟达的实习生提出零样本风格迁移:多模态CLIP玩出花,只用文本就能干CV的活!
|
人工智能 算法 开发者
AlphaGo被授职业九段,DeepMind将公开其所有版本细节
5 月 27 日,经过 3 小时 38 分钟的鏖战,209 手,柯洁盘中投子再负 AlphaGo,至此中国乌镇围棋峰会圆满告落。赛后,中国围棋协会为授予AlphaGo职业九段称号。
371 0
AlphaGo被授职业九段,DeepMind将公开其所有版本细节