李飞飞最新研究成果!斯坦福正在用算法判断政治倾向

简介:
本文来自AI新媒体量子位(QbitAI)

c352c6c5a2dc5169cd2ac2451ba7fdade54aec0f

“什么样的人,开什么样的车。”

宾利、MPV、皮卡,不同的汽车都能透露出车主的个性差异。

而斯坦福研究人员则将这种思维更进一步:通过对谷歌街景中的海量图片进行识别和分析,他们便可借助某个社区的汽车判断当地人的政治倾向。

“使用可以轻易获取的视觉数据,我们便可对自己的社区展开很多了解,堪比花费数十亿美元通过人口普查获得的一些信息。更重要的是,这项研究打开了更多可能,让我们可以使用很便宜的视觉数据对社会展开持续不断的研究。”斯坦福大学计算机科学副教授兼斯坦福人工智能实验室主任李飞飞说。

9e26b939ac21164ee999e846037db303c1f4df64

 斯坦福计算机科学副教授兼斯坦福AI实验室主任李飞飞

李飞飞是计算机视觉和深度学习领域的专家,这种技术可以教给电脑自己在2D图像中识别3D物体——按照他们的说法,就是让计算机可以看见东西。

这种算法会接受训练(更准确地说是自我训练),通过这种方式来识别200个美国城市的5000多万张谷歌街景图片,从而在其中认出从1990年以来的每一个车型。

之后将车型和位置数据与两个数据库进行对比,一个是当今最全面的人口统计学数据库美国社区调查(American Community Survey),另外一个则是美国总统大选投票数据库,其中包含了种族、教育、收入和投票倾向等信息。

李飞飞和她的团队发现汽车、人口统计学信息和政治派别之间存在简单的线性关系。他们在11月28日发表在《美国国家科学院院刊》上的论文中表示,这种社会关系“简单而强大”。

例如,如果一个社区的轿车数量多于皮卡,那么这个选区就有88%的概率支持民主党。如果皮卡多于轿车,那就有82%的可能支持共和党。

aebc212cf8f96146066105960ffeac9640e1cd8a

 旧金山居民区街景(Google街景)

数据更新及时且持续

除了明显的政治影响外,研究人员还认为,他们的算法有助于对现有的人口调查提供及时而持续的补充。

美国社区调查目前是通过成本高昂的上门访谈来实现的,每年花费超过2.5亿美元。即便通过如此高昂的成本,从数据收集到正式发布仍然存在一定的延迟,可能达到两年甚至更多,尤其是在小城市和乡村地区。

相比而言,李飞飞的这种算法可以使用定期更新的公开数据库,几乎可以实时得出分析结果。

“我不认为这可以取代美国社区调查,但却可以成为一种补充,保持数据更新。”李飞飞实验室前成员、该论文的第一作者Timnit Gebru说。Gbru目前是微软研究院人工智能事业部的博士后研究员。

Gebru表示,要实现这一目标并非易事。该团队首先必须手动构建一个包含1990年以来的所有汽车的数据库,然后交给电脑如何识别不同车型之间的细微差异,尤其是在一些模糊的图像中。

算法更能洞察细节

他们首先从汽车销售网站Edmunds.com上获得了1.5万辆汽车的数据库,但这只是个开始。人类专家接下来还要逐一按照细微差别对汽车进行归类。例如,2007和2008款本田雅阁之间的差异只体现在尾灯上。

算法速度很快,只需要两个星期就能按照品牌、型号和年限将5000万张图片中的汽车分成2657个类别。即使速度较快的人类专家也只能每分钟分类6张照片,需要15年才能完成同样的任务。

Gebru表示,有的外部研究人士对此表示质疑。他们指出,照片拍摄时间的不同会对交通状况和汽车构成产生影响。Gebru补充道,为了避开拥挤的交通,很多街景照片都是早晨拍摄的,这便可以提升照片的一致性。无论交通状况如何,这些图片都能提供有价值的数据。

“如果你在社区走一走,看看那里的汽车,车流密度有的时候可以比车型提供更多信息。”Gebru说,“算法可以对这些信息加以利用。”

Gebru对她的这项新应用有着很高的期望。她希望能够突破人口统计的局限,用视觉分析针对难以达到的领域改进调查结果,或者用于监控二氧化碳浓度和缓解交通拥堵。

李飞飞也认同这种看法。“它能帮助我们理解社会的运作状况,理解人们的需求,以及我们如何改善生活。”她说,“计算机视觉技术在建设性的方面和慈善领域有很大的应用前景。”

本文作者:李杉
原文发布时间:2017-11-30
相关文章
|
8月前
|
机器学习/深度学习 算法 机器人
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
747 0
|
8月前
|
存储 机器学习/深度学习 编解码
双选择性信道下正交啁啾分复用(OCDM)的低复杂度均衡算法研究——论文阅读
本文提出统一相位正交啁啾分复用(UP-OCDM)方案,利用循环矩阵特性设计两种低复杂度均衡算法:基于带状近似的LDL^H分解和基于BEM的迭代LSQR,将复杂度由$O(N^3)$降至$O(NQ^2)$或$O(iNM\log N)$,在双选择性信道下显著提升高频谱效率与抗多普勒性能。
483 0
双选择性信道下正交啁啾分复用(OCDM)的低复杂度均衡算法研究——论文阅读
|
9月前
|
传感器 机器学习/深度学习 算法
【UASNs、AUV】无人机自主水下传感网络中遗传算法的路径规划问题研究(Matlab代码实现)
【UASNs、AUV】无人机自主水下传感网络中遗传算法的路径规划问题研究(Matlab代码实现)
236 0
|
8月前
|
存储 监控 算法
基于 Go 语言跳表结构的局域网控制桌面软件进程管理算法研究
针对企业局域网控制桌面软件对海量进程实时监控的需求,本文提出基于跳表的高效管理方案。通过多级索引实现O(log n)的查询、插入与删除性能,结合Go语言实现并发安全的跳表结构,显著提升进程状态处理效率,适用于千级进程的毫秒级响应场景。
318 15
|
8月前
|
机器学习/深度学习 算法 自动驾驶
基于导向滤波的暗通道去雾算法在灰度与彩色图像可见度复原中的研究(Matlab代码实现)
基于导向滤波的暗通道去雾算法在灰度与彩色图像可见度复原中的研究(Matlab代码实现)
427 8
|
9月前
|
机器学习/深度学习 传感器 算法
【高创新】基于优化的自适应差分导纳算法的改进最大功率点跟踪研究(Matlab代码实现)
【高创新】基于优化的自适应差分导纳算法的改进最大功率点跟踪研究(Matlab代码实现)
405 14
|
9月前
|
运维 监控 JavaScript
基于 Node.js 图结构的局域网设备拓扑分析算法在局域网内监控软件中的应用研究
本文探讨图结构在局域网监控系统中的应用,通过Node.js实现设备拓扑建模、路径分析与故障定位,提升网络可视化、可追溯性与运维效率,结合模拟实验验证其高效性与准确性。
494 3
|
9月前
|
canal 算法 vr&ar
【图像处理】基于电磁学优化算法的多阈值分割算法研究(Matlab代码实现)
【图像处理】基于电磁学优化算法的多阈值分割算法研究(Matlab代码实现)
256 1
|
9月前
|
存储 监控 算法
企业电脑监控系统中基于 Go 语言的跳表结构设备数据索引算法研究
本文介绍基于Go语言的跳表算法在企业电脑监控系统中的应用,通过多层索引结构将数据查询、插入、删除操作优化至O(log n),显著提升海量设备数据管理效率,解决传统链表查询延迟问题,实现高效设备状态定位与异常筛选。
219 3
|
9月前
|
机器学习/深度学习 运维 算法
【微电网多目标优化调度】多目标学习者行为优化算法MOLPB求解微电网多目标优化调度研究(Matlab代码实现)
【微电网多目标优化调度】多目标学习者行为优化算法MOLPB求解微电网多目标优化调度研究(Matlab代码实现)
374 1

热门文章

最新文章