想让AI读懂时尚?看看亚马逊新发的这两篇论文

简介:
本文来自AI新媒体量子位(QbitAI)

亚马逊想让AI读懂时尚。

在Echo Look中加入穿搭指导功能引发大量吐槽后,目前,亚马逊又发表了两篇与时尚相关的研究。

洛杉矶亚马逊实验室近日发明了一种从图像中学习服装风格算法,可以从头开始设计风格相似的衣服。

与此同时,以色列的亚马逊研究人员正在用机器学习开发一种新技术,它能够通过分析几个附在图片上的标签判断这套服装是否流行。

这两项研究的相关论文均在上周于加拿大哈利法克斯举行的KDD 2017大会上公布。其所在的workshop探讨了计算机视觉、机器学习和其他先进技术如何在时装业中使用,看来AI是立志要在时尚界搅点新潮流出来了。

听起来都燃,但距离这些的技术影响你的衣柜还需要一段时间。

论文概述

洛杉矶团队发表的论文题为《Toward beter reconstruction of style images with GANs》,以色列团队的论文题为《Learning Fashion Traits with Label Uncertainty》。量子位将两篇论文的摘要等重要部分编译整理如下:

用GAN重建服装图像

近日用生成式对抗网络(GAN)做逆映射的浪潮兴起,也就是让数据从数据空间逆映射到潜在空间。这种映射能对图像进行重建,无论是编码还是解码,都能在紧凑的潜在空间完成。框架中损失函数的选择对重建的质量至关重要。

在这篇论文中,我们摸索了损失函数可能的选择,并将此应用到图像风格的定性评估上。同时,我们也引入了一种损失函数,惩罚不完美的潜在空间重建并使它和双向编码和生成不同风格图片的GAN框架。实验证明,这种惩罚帮助重构出更现实的图像。

在这篇文章中,我们重点关注编码和解码服装图像,对GAN重构图像尤其感兴趣——也就是将图像通过编码映射到潜在空间,之后再通过解码将隐藏代码映射到图像空间,从而重构原图创造出与原风格相似的图像。

在实验中,我们摸索了损失函数可能的选择,并将此应用到图像风格的定性评估上。同时也引入了一种损失函数,惩罚不完美的潜在空间重建并使它和双向编码和生成不同风格图片的GAN框架。实验证明,这种惩罚帮助重构出更现实的图像。

如果我们重建的图像效果良好,即可被应用在很多地方,可以在潜在空间中轻松改变某个图像的风格。比如虚拟试衣,这就是重建特殊服装图像的实例。

学习标签不确定的时尚特征

我们想根据图像预测主观的时尚特征,同时对理解哪套服装更适合用户这个任务尤其感兴趣。因为这些特征因人而异,非常主观,所以这个任务自带很多噪音。

一个解决方案是为每个样例做多次注释,但是这样很难收集大量数据。出于可行性的考虑,大数据集中的样例只有少数的人为标记。因为标签是用少量人为标记预测的,所以这种方法引入了不确定的样例。

我们提出一种封闭式模型模拟副次抽样所引起的标签不确定性,结果显示模型基本具备从时尚相关的噪声数据中量化学习算法的能力。我们进而用此模型构建了自定义神经网络损失函数,让它能更好地学习时尚特征。

最后,附论文下载地址——

GAN重建服装图像:

https://kddfashion2017.mybluemix.net/final_submissions/ML4Fashion_paper_13.pdf

学习时尚特征:

https://kddfashion2017.mybluemix.net/final_submissions/ML4Fashion_paper_14.pdf

本文作者:安妮
原文发布时间:2017-08-25 
相关文章
|
5月前
|
机器学习/深度学习 人工智能 安全
【论文速递】CSET - 小数据的大AI潜力
【论文速递】CSET - 小数据的大AI潜力
49 0
|
9天前
|
人工智能 自然语言处理 算法
几款宝藏级AI阅读工具推荐!论文分析、文档总结必备神器!
【10月更文挑战第7天】几款宝藏级AI阅读工具推荐!论文分析、文档总结必备神器!
29 1
几款宝藏级AI阅读工具推荐!论文分析、文档总结必备神器!
|
1月前
|
人工智能 开发者
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
【9月更文挑战第8天】《自然》杂志近日揭露,学术出版商如泰勒·弗朗西斯与微软签订千万美元合约,及威利获高额报酬,将论文提供给科技巨头训练AI模型,引发学界对版权与收益分配的热议。此现象反映了AI对高质量数据的渴求,但亦使研究人员担忧成果被无偿商用,且可能影响学术独立性。尽管AI训练使用学术资源能提升模型科学性,助力科研进展,但如何保障作者权益及维持学术纯粹性仍是亟待解决的问题。https://www.nature.com/articles/d41586-024-02599-9
42 4
|
5月前
|
机器学习/深度学习 人工智能 数据挖掘
ICLR 49.9%论文疑有AI审稿
【5月更文挑战第20天】ICLR会议上一篇研究引发关注,推测近50%的论文可能由AI进行审稿,挑战传统审稿流程。研究者运用机器学习分析历史审稿数据,发现可能的AI审稿模式。该研究提出AI审稿可减轻审稿人负担,提高效率,但也面临证据不足、理解复杂学术概念限制及审稿行为多样性等问题。学术界需谨慎评估AI在审稿中的角色,以确保质量和公正性。[论文链接](https://arxiv.org/abs/2405.02150)
87 1
|
5月前
|
人工智能
AI大咖说-如何评价论文的创新性
《AI大咖说》探讨论文创新性,强调新意、有效性和领域研究问题的重要性。创新点在于用新颖方法有效解决研究问题。评价公式:价值=问题大小*有效性*新意度。该观点源于《跟李沐学AI》视频,提供1-100分评分标准,助力评估论文价值。5月更文挑战第14天
77 3
|
5月前
|
机器学习/深度学习 人工智能
论文介绍:AI击败最先进全球洪水预警系统,提前7天预测河流洪水
【5月更文挑战第4天】研究人员开发的AI模型(基于LSTM网络)成功击败全球最先进的洪水预警系统,能在未设测站流域提前7天预测洪水,显著提升预警时间,降低灾害影响。该模型使用公开数据集,减少了对长期观测数据的依赖,降低了预警系统的成本,有望帮助资源有限的地区。然而,模型的性能可能受特定流域条件影响,泛化能力和预测解释性仍有待改进。[论文链接](https://www.nature.com/articles/s41586-024-07145-1)
140 11
|
5月前
|
机器学习/深度学习 人工智能
ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
【2月更文挑战第25天】ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
90 7
ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
|
5月前
|
数据采集 人工智能 数据挖掘
【AI大模型应用开发】【附】常用Prompt记录 - 论文全文写作
【AI大模型应用开发】【附】常用Prompt记录 - 论文全文写作
204 0
【AI大模型应用开发】【附】常用Prompt记录 - 论文全文写作
|
5月前
|
人工智能
【SCI论文】“学术丑闻揭露:当AI写作遭遇学术审稿,ChatGPT意外成为论文共作者!“
最近,一篇发表在《Surfaces and Interfaces》的论文引起了广泛关注,因为其中意外包含了ChatGPT的提示语,暴露出学术审稿过程中的疏忽。这篇论文讨论了铜基金属-有机框架-芳香族纤维素分隔器对锂金属阳极电池的影响,但却出现了不该出现的ChatGPT对话内容。这一事件不仅令人哭笑不得,还引发了对学术审核严谨性的质疑。它反映了当前学术界可能过度依赖AI写作工具,忽略了基本的检查和编辑步骤。这一事件提醒学术界必须加强审查机制和自律,确保论文质量,防止类似尴尬情况的再次发生。
209 4
【SCI论文】“学术丑闻揭露:当AI写作遭遇学术审稿,ChatGPT意外成为论文共作者!“
|
5月前
|
机器学习/深度学习 人工智能 算法
AI大咖说-如何有效的读论文
# AI大咖李沐教你高效读论文 李沐,亚马逊资深首席科学家,MXNet框架作者,推荐其在B站的“跟李沐学AI”。他建议读论文分三步:粗读(标题、摘要、结论)、快速浏览(整体理解)和精读(深入细节)。通过这三遍阅读,判断论文是否相关,理解解决问题的方法和实验。5月更文挑战第13天
79 0