盘点| NIPS(神经信息处理系统进展大会)机器学习相关内容

简介:

今年的NIPS会议(神经信息处理系统进展大会)是当下人工智能和深度学习热情的一个聚焦点 —— 从中能够感受到机器学习领域的飞速发展,并且公开了两家新的人工智能初创公司。参会人数相比2014年的大会几乎翻倍(希望明年主办方能设置多个分场),一些受欢迎的工作坊内摩肩接踵。由于大会有将近4000人参加却只接收400篇论文,大部分人还是冲着学习和社交的目的而来。会议期间紧张的社交活动让我想起了Burning Man(美国的一个反传统狂欢节)—— 激动人心的感觉,高密度的自发的有趣交流,短期内的大量活动,当然还有持续的疲惫状态。

有趣的演讲和海报

Sergey Levine在拥挤的Deep Reinforcement Learning工作坊做的机器人演示(我们提早半个小时到达,才在地板上占据一席)。这个演讲让我感受到该领域迅猛的发展。演讲是从一段今年夏天DARPA机器人挑战赛的视频开始,机器人试图行走和开门的时候,不断地失败。Levine接着介绍了他的近期研究内容,主要是引导策略搜索(guided policy search),在轨迹优化和神经网络的监督训练之间交替进行,还有复杂任务的分解。他演示的机器人视频成功地完成了多个高度灵活的任务,比如开门,拧瓶盖,把衣服架在衣架上。令人印象深刻!

Denton和Chintala带来的是用金字塔形对抗网络生成图片的模型。用一个神经网络作为生成器来生成逼真的图像,另一个神经网络来评价 —— 前者试图生成以假乱真的图片来迷惑后者,而后者需要将合成图片与真实图片区分开来。首先从一张粗糙的图像开始,通过金字塔形的对抗网络生成后一级比前一级更细致的图像。在实验中,最终的结果有40%被误认为是真实图像,在我制作海报的时候,大约有80%的图像在我眼里就是真实的。

0?wx_fmt=jpeg
Salakhutdinov等人介绍的Path-SGD算法,一种尺度不变的随机梯度下降算法。标准的SGD使用L2正则项来衡量参数空间的距离,权重的缩放会对优化效果产生巨大影响。相对于把最大的权重值作为单位长度,Path-SGD方法则是最小化所有经过缩放权重值的max-norm。这样得到的norm(称作“path regularizer”)被证明对权重缩放具有不变性。这个方法有原理支持,并且取得良好的实践结果。

0?wx_fmt=jpeg
Sukhbaatar等人介绍的端到端记忆网络 —— 记忆网络的一种扩展 —— 神经网络学习对记忆模块的读取和写入。与传统的记忆网络不同,这个端到端的版本不需要在每一层监督。这扩展了该方法的适用领域 —— 它与记忆网络在问答方面、与LSTM在语言模型方面都很有竞争力。观察这个模型完成基本的归纳推理任务也很有趣,比如物体的位置、颜色、大小等。

Algorithms Among Us 研讨会

本次大会的一个亮点就是Algorithms Among Us 研讨会对机器学习的社会影响,我和其它FLI成员一起参与组织的。研讨会由三个板块和一些演讲组成 —— 包括近期的人工智能影响,通用人工智能的时间表,以及效益型人工智能的重点研究计划。研讨会的组织者 (Adrian Weller, Michael Osborne and Murray Shanahan) 召集了一大波AI各个方向的大腕,包括来自微软的Cynthia Dwork,来自Facebook的Yann LeCun,来自百度的Andrew Ng和来自DeepMind的Shane Legg。

Andrew Ng对他著名的观点“担心通用人工智能就像担心火星上人口过剩”又进行了升华,改为了“半人马座阿尔法星人口过剩”(难道火星人口过剩真的会发生?)他的主要观点是即使超级预言家无法预知五年后的任何事情,所以任何长期的预测也都是无用的。这似乎像是人们普遍信念“我们一无所知,所以我们很安全”的一个实例。正如Murray所说,今后五年的完全不确定性也正意味着无法猜测未来20年实现通用人工智能的景象。令人鼓舞的是Ng赞同长期人工智能安全性的研究,他说这尽管不是他的兴趣点,但应该有其它人去做。

在谈到通用AI之路上剩余的里程碑时,Yann LeCun给了一个贴切的比喻,就像在迷雾中翻山越岭旅行 —— 你能看到一部分,雾中还隐藏着未知事物。他还认为高级AI是不可能像人类一样,告诫不要将它拟人化。

在重点研究计划版块,Shane Legg给了一些具体的建议 —— 目标系统的稳定性、可中断性、沙箱/容器化,以及各种思维实验的形式化(例如超智 Superintelligence)。他指出AI安全既被夸大了,又得不到足够重视 —— 而先进AI的风险不是如媒体所述的迫在眉睫,更多的思考和资源需要被投入到具有挑战性的研究问题中。

讨论会上提出的一个问题是关于AI系统可解释性的重要性,它也是我当前研究项目的主题。AI系统在有效性和可解释性的权衡之间存在一些分歧。LeCun认为解释性的主要优势是提高鲁棒性,提高迁移学习水平应该就能实现,而不需要降低有效性。Percy Liang则认为需要透明性来给其它人解释机器学习系统做了什么,在许多应用中这变得日趋重要。LeCun还指出机器学习系统通常被认为是透明的,如决策树,而事实未必如此。人们对可解释性的含义也存在歧义 —— Cynthia Dwork觉得,我们需要在作出任何结论前对问题有一个明确的定义。看来,在定义可解释性和在不牺牲效能的前提下实现可解释性,都还有很多工作要做。

总之,该研讨会超级有趣,提供了大量的精神粮食(FLI成员Ariel做了一个更详细的总结)。感谢Adrian、Michael和Murray的辛勤工作。

AI初创公司

两家新的AI初创公司在NIPS大会上宣告成立是一件令人兴奋的事情 —— 由Ilya Sutskever领导和Musk, Altman等人支持的OpenAI,以及由 Zoubin Ghahramani和Gary Marcus领导的Geometric Intelligence。

OpenAI是一家非营利性企业,肩负着推进AI研究大众化和保持其对人类有益的使命,有高达10亿美元的承诺资金。他们相信在非盈利的、不受经济利益影响的环境下发展AI技术更安全,而不是被营利性公司所垄断。开源共享研究项目的想法在中短期内无疑是好的,但长期来看接近通用AI时会引起一些担忧。一位OpenAI的研究员在采访中表示,“我们没有义务分享一切 —— 在这种情况下公司的名字有误导性”,而且项目是否开源事实上也是具体案例具体分析。

OpenAI在最初几年内计划把重点放在深度学习领域,Geometric Intelligence的发展方式有所不同,他们想用更少的数据来更有效地学习。Gary Marcus认为们需要更多地学习人类大脑是如何获得知识的,从而开发先进AI系统(灵感来自于观察他孩子认知世界的过程)。我期待着来自这些新公司和其他研究小组采取的各种方法和成果。

原文发布时间为:2015-12-30

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
1月前
|
机器学习/深度学习 数据采集 数据可视化
基于爬虫和机器学习的招聘数据分析与可视化系统,python django框架,前端bootstrap,机器学习有八种带有可视化大屏和后台
本文介绍了一个基于Python Django框架和Bootstrap前端技术,集成了机器学习算法和数据可视化的招聘数据分析与可视化系统,该系统通过爬虫技术获取职位信息,并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析,提供了一个直观的可视化大屏和后台管理系统,以优化招聘策略并提升决策质量。
|
3月前
|
机器学习/深度学习 数据采集 搜索推荐
机器学习在智能推荐系统中的个性化算法研究
机器学习在智能推荐系统中的个性化算法研究
|
1月前
|
机器学习/深度学习 数据采集 数据可视化
基于python 机器学习算法的二手房房价可视化和预测系统
文章介绍了一个基于Python机器学习算法的二手房房价可视化和预测系统,涵盖了爬虫数据采集、数据处理分析、机器学习预测以及Flask Web部署等模块。
基于python 机器学习算法的二手房房价可视化和预测系统
|
1月前
|
机器学习/深度学习 数据可视化 数据处理
Python vs R:机器学习项目中的实用性与生态系统比较
【8月更文第6天】Python 和 R 是数据科学和机器学习领域中最受欢迎的两种编程语言。两者都有各自的优点和适用场景,选择哪种语言取决于项目的具体需求、团队的技能水平以及个人偏好。本文将从实用性和生态系统两个方面进行比较,并提供代码示例来展示这两种语言在典型机器学习任务中的应用。
47 1
|
1月前
|
机器学习/深度学习 算法
【Deepin 20系统】机器学习分类算法模型xgboost、lightgbm、catboost安装及使用
介绍了在Deepin 20系统上使用pip命令通过清华大学镜像源安装xgboost、lightgbm和catboost三个机器学习分类算法库的过程。
22 4
|
2月前
|
机器学习/深度学习 数据采集 运维
智能化运维:利用机器学习优化系统性能
在当今快速发展的信息技术时代,传统的运维方式已难以满足日益增长的业务需求和复杂性。本文将探讨如何通过机器学习技术来提升运维效率,确保系统的高可用性和性能优化。我们将深入分析机器学习模型在预测系统负载、自动故障检测与响应以及资源分配中的应用,并讨论实施这些策略时可能遇到的挑战和解决思路。
|
2月前
|
机器学习/深度学习 数据采集 人工智能
智能运维:机器学习在系统维护中的应用与挑战
本文深入探讨了机器学习技术在IT运维领域的应用,并分析了其带来的优势及面临的主要挑战。文章首先概述了智能运维的发展历程和当前趋势,随后详细讨论了机器学习技术如何优化故障预测、自动化处理流程以及增强安全监控。最后,文中指出了实施过程中可能遇到的技术和管理难题,为读者提供了对智能运维未来发展方向的深刻见解。
|
3月前
|
机器学习/深度学习 人工智能 算法
【昆虫识别系统】图像识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+TensorFlow+ResNet50
昆虫识别系统,使用Python作为主要开发语言。通过TensorFlow搭建ResNet50卷积神经网络算法(CNN)模型。通过对10种常见的昆虫图片数据集('蜜蜂', '甲虫', '蝴蝶', '蝉', '蜻蜓', '蚱蜢', '蛾', '蝎子', '蜗牛', '蜘蛛')进行训练,得到一个识别精度较高的H5格式模型文件,然后使用Django搭建Web网页端可视化操作界面,实现用户上传一张昆虫图片识别其名称。
269 7
【昆虫识别系统】图像识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+TensorFlow+ResNet50
|
2月前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在系统维护中的角色与影响
随着技术的不断进步,机器学习已成为推动智能运维发展的关键力量。通过分析历史数据、模式识别和预测性维护,机器学习不仅优化了传统运维流程,还极大地提高了效率和准确性。本文将探讨机器学习在智能运维中的应用,包括故障预测、自动化响应和资源优化等方面,旨在为读者提供深入的理解和可行的应用建议。
|
2月前
|
机器学习/深度学习 数据采集 人工智能
ERP系统中的人工智能与机器学习应用:提升企业智能化管理
【7月更文挑战第29天】 ERP系统中的人工智能与机器学习应用:提升企业智能化管理
195 0

热门文章

最新文章

下一篇
DDNS