选择能代表一个品牌的时尚模特这份工作真心不容易。遍寻任何模特信息数据库,选角导演要在上千名模特中为每个杂志封面、社会活动或者伸展台走秀上挑选出最适合的那一个。这些年来该选择哪一名模特已经变得越来越复杂,因为现在的社交媒体在任何一名模特的职业生涯中都扮演着重要角色。
现在有些模特的脸会很快变得比其他人受欢迎。这表明当面临着同样的信息时,通常指身体大小和身形、模特机构、先前经历以及模特照片,选角导演通常会做出同样的选择。
这提出了一个有趣的问题:在其它信息相同的情况下,经过适当训练的机器是否能做出同样的选择乃至于预测哪一位模特更有可能出现在下一季的T台上呢?
现在,感谢印第安纳大学伯明顿校区的Jaehyuk Park及其同事,我们终于知道了这一问题的答案。这些家伙利用机器学习算法来找出与未来模特事业成功与否(由模特在伸展台上出现的次数进行衡量)的相关因素。他们说当他们的方法将模特在社交媒体上受欢迎的程度考虑在内时,结果甚至更加准确。
开始时,该团队下载了被收录到时装模特指南(Fashion Model Directory,一个重要的行业登记网站)中431名新晋女性模特的相关信息。该网站给出了每位模特的不同信息,比如姓名、年龄、体重、身高、臀围、腰围和衣号等等。不出意外的是,这些数据显示这些模特比其它模特更高、更瘦也更轻。
时装模特指南还列出了每位模特所在的机构(该团队会将其评价为顶级机构或者非一流机构)和她迄今为止的经验,比如上杂志封面和出现在伸展台上的次数。
作为新面孔,这些模特均拥有相似的、有限的经验,2014年9月纽约、伦敦、巴黎和米兰的时装周中,她们每人平均出现在伸展台上的次数为3.25次。这一数字非常具有欺骗性,因为在这些时装周中,她们大部分人均未单独走过一次伸展台,只有百分之二十四的新晋模特单独走过一次或者多次伸展台。
该团队还在INS(也许这是时尚界最具影响力的社交网络)上收集了每位模特出现的信息。他们发现几乎百分之六十出身于顶级模特机构的模特更有可能出现在INS上。
Park与其同事继续收集三个月内关于2015年九月时装周每位模特发的社交帖,包括点赞数和评论这些元数据。他们甚至将评论中的情绪计算在内以便确定每位模特受欢迎或者被讨厌的程度。
收集完所有这些数据之后,他们使用各种机器学习算法来比较这些走过一次或者多次伸展台的新人与从未走过伸展台新人之间的关系。
结果非常有趣。多种因素与伸展台上受欢迎程度之间有明确关联,比如个高的模特更受欢迎,其身高每增加一厘米其走上伸展台的机会就会加倍。成为顶尖模特机构的首推模特甚至更重要,它能将一位模特出现在伸展台上的次数增加10次。
可以预见的是,更长的裙子、更大的臀围和更大的鞋子等因素与模特成功与否成负相关,而腰围则对模特没什么影响。
社交媒体也很重要,但对模特的影响并不总是非常明显。在INS帐户上收到的评论越多说明这位模特走上伸展台的机会越大。但奇怪的是,拥有的点赞次数越多反而会将模特走上伸展台的机会降低百分之十。
重要的一点来了。发现了这些相关性之后,Park与其同事试图利用这些来预测模特走上时装周的可能性,尤其是2015年2月与3月之间的时装周。他们再次在时装模特指南中下载了15名模特的数据及她们的INS数据。(尚不清楚为何这次只用这么点新人数据。)
最终,他们利用他们的机器学习算法预测出哪些模特将走上时装周的伸展台而哪些模特不能。
最佳算法正确预测出8位模特中将有6位成为伸展台的宠儿。(事实上该算法正确预测出图中所有模特都将变得更加成功。)Park及其同事表示他们的框架成功预测出大部分2015年新晋模特中将变得受欢迎的人。
该团队分析在这些预测中哪些因素最重要之后发现社交媒体扮演了重要角色。他们说:“我们发现比起与顶尖模特机构签约或者由模特界规定的审美标准,在社交媒体上有较高出现频率也许更重要。”
不过这一研究也有不少缺憾。最严重的一点在于该团队演示的预测功效只有15名模特,他们希望这一模型将来能处理更大的数据。
该团队以模特走伸展台的次数来衡量她们成功与否,这一点也有问题。任何一名模特告诉你在伸展台上出现的次数距离远远不足以衡量一名模特是否重要且有价值。当然这也是该团队希望未来他们能够处理的事情。
另外一个限制在于结果只适用于女性模特,而男性模特的数据缺乏研究。
不论怎样,Park及其同事为这一极其不透明的行业提供了一些有趣的观点。众所周知的是时尚界残酷无情。这是一个被适者生存机制统治者的行业,在所有这些情况下,即便最小的优势也会变得至关重要。这对任何崭露头角的超模来说拥有至关重要的意义——一个强势的INS帐户也会成为未来成功和失败之间的差异。
原文发布时间为:2015-09-08
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号