AI大事件 | Geoffrey Hinton决定抛弃反向传播,预期策略梯度算法

简介: 本周的AI大事件:Facebook人工智能研究登陆蒙特利尔;Sophia Genetics筹集了3000万美元帮助医生使用人工智能和基因组数据进行诊断;Geoffrey Hinton决定抛弃反向传播


image

呜啦啦啦啦啦大家好呀,又到了本周的AI大事件时间了。过去的一周中AI圈都发生了什么?大佬们互撕了哪些问题?研究者们发布了哪些值得一读的论文?又有哪些开源的代码和数据库可以使用了?文摘菌带你盘点过去一周AI大事件!

了解过去一周AI爆点,一篇就够啦!

新闻
Geoffrey Hinton决定抛弃反向传播
来源:WWW.AXIOS.COM
链接:https://www.axios.com/ai-pioneer-advocates-starting-over-2485537027.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
现在几乎所有神经网络都会经过反向传播的训练。然而在最近的一次采访中,Hinton,深度学习之父却表示,他将“抛开一切重新开始”。要想在深度学习上向前推进,就必须发明全新的方法。

Facebook人工智能研究登陆蒙特利尔
来源:NEWSROOM.FB.COM
链接:https://newsroom.fb.com/news/2017/09/fair-montreal/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
作为Facebook的人工智能研究的一部分(FAIR),这个新的团队将由超过100名来自门洛帕克、纽约和巴黎的科学家组成,他们将努力推进人工智能领域的研究。
蒙特利尔实验室将对AI领域进行广泛的研究,但它也将特别关注强化学习和对话系统。

Sophia Genetics筹集了3000万美元帮助医生使用人工智能和基因组数据进行诊断
来源:VENTUREBEAT.COM
链接:https://venturebeat.com/2017/09/13/sophia-genetics-raises-30-million-to-help-doctors-diagnose-using-ai-and-genomic-data-analysis/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
9月13日消息,瑞士医疗数据分析公司Sophia Genetics宣布完成3000万美元D轮融资,Balderton Capital领投,Alychlo、Invoke Capital Partners、360 Capital Partners等跟投。

Sophia Genetics成立于2011年,是一家遗传信息数据分析公司,专注于通过人工智能找出患者基因突变原理,并结合专家意见提供个性化的治疗诊断方案。

文章&教程
学习其他代理想法的模型(OpenAI)
来源:BLOG.OPENAI.COM
链接:https://blog.openai.com/learning-to-model-other-minds/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
一种算法,它解释了其他代理也在学习的事实,并在迭代囚徒困境中发现了类似于针锋相对的合作策略。

AI健身房
来源:LEARNINGAI.IO
链接:https://learningai.io/projects/2017/07/28/ai-gym-workout.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
一个易于理解的近端策略优化( Proximal Policy Optimization)的介绍(PPO)并且能够很好的应对MuJoCo 和 RoboSchool 的环境。点击这里查看代码:https://github.com/pat-coady/trpo

使用强化学习达到最优化
来源:BAIR.BERKELEY.EDU
链接:http://bair.berkeley.edu/blog/2017/09/12/learning-to-optimize-with-rl/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
机器学习的算法仍然是人工设计的。这就引出了一个自然的问题:我们可以学习这些算法吗?

项目&数据
使用TensorBoard API完成自定义可视化
来源:RESEARCH.GOOGLEBLOG.COM
链接:https://research.googleblog.com/2017/09/build-your-own-machine-learning.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
为了让学习者能够使用新的和有用的可视化进行创作,谷歌公布了一组API,允许开发人员添加自定义的可视化插件到TensorBoard。

膨胀残留网络(Dilated Residual Network)的实现
来源:GITHUB.COM
链接:https://github.com/fyu/drn?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
基于膨胀卷积的多元内容集成和膨胀残留网络的官方PyTorch实现。

对TensorFlow数据集和估计机制(Estimators)的介绍
来源:DEVELOPERS.GOOGLEBLOG.COM
链接:https://developers.googleblog.com/2017/09/introducing-tensorflow-datasets.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
TensorFlow 1.3介绍了两个重要的特点:数据集和估计机制。这篇文章显示了他们如何适应TensorFlow架构。

数据集 | 一万本最受欢迎的书:一万本书,六百万次阅读
来源:GITHUB.COM
链接:https://github.com/zygmuntz/goodbooks-10k?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
该数据集包含了goodreads.com上一万本最受欢迎的书,其中最受欢迎的被阅读了六百万次。

爆款论文
针对工程师的机器学习简介
来源:ARXIV.ORG
链接:https://arxiv.org/abs/1709.02840?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
一个200页的“简短”的介绍。这项工作旨在介绍机器学习中的关键概念、算法和理论框架,包括监督和无监督学习、统计学习理论、概率图形模型和近似推理。

把所有东西都嵌入进去!
来源:ARXIV.ORG
链接:https://arxiv.org/abs/1709.03856?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
一个通用的神经嵌入模型,可以解决各种各样的问题:标签型任务,如文本分类;排序型任务,如信息检索、网络搜索、基于协同过滤和基于内容的推荐;多关系图的嵌入,并能够实现单词、句子或文档级的嵌入。在每种情况下,模型都是通过嵌入由离散特征组成的实体来实现的,并将对它们进行比较——学习依赖于任务的相似性。

预期策略梯度算法
来源:ARXIV.ORG
链接:https://arxiv.org/abs/1706.05374?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
预期策略梯度算法(EPG:Expected policy gradients)使强化学习中的随机策略梯度算法(SPG: stochastic policy gradients )和确定性策略梯度算法(DPG: deterministic policy gradients )达成了一致。这一算法的灵感来自于预期的SARSA算法,EPG在估计梯度的时候整合了整个操作,而不是仅仅依赖于采样轨迹。

原文发布时间为:2017-09-19
编译 | 宁云州
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”微信公众号

相关文章
|
15天前
|
机器学习/深度学习 人工智能 算法
深度学习入门:理解神经网络与反向传播算法
【9月更文挑战第20天】本文将深入浅出地介绍深度学习中的基石—神经网络,以及背后的魔法—反向传播算法。我们将通过直观的例子和简单的数学公式,带你领略这一技术的魅力。无论你是编程新手,还是有一定基础的开发者,这篇文章都将为你打开深度学习的大门,让你对神经网络的工作原理有一个清晰的认识。
|
12天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习还不如浅层网络?RL教父Sutton持续反向传播算法登Nature
【9月更文挑战第24天】近年来,深度学习在人工智能领域取得巨大成功,但在连续学习任务中面临“损失可塑性”问题,尤其在深度强化学习中更为突出。加拿大阿尔伯塔大学的研究人员提出了一种名为“持续反向传播”的算法,通过选择性地重新初始化网络中的低效用单元,保持模型的可塑性。该算法通过评估每个连接和权重的贡献效用来决定是否重新初始化隐藏单元,并引入成熟度阈值保护新单元。实验表明,该算法能显著提升连续学习任务的表现,尤其在深度强化学习领域效果明显。然而,算法也存在计算复杂性和成熟度阈值设置等问题。
25 2
WK
|
22天前
|
机器学习/深度学习 监控 算法
反向传播算法是如何工作的
反向传播算法通过最小化损失函数优化神经网络。首先,输入数据经由前向传播得到预测结果,并计算损失;接着,反向传播计算各参数的梯度,并利用梯度下降法更新权重和偏置。这一过程反复进行,直至满足停止条件。算法具备高效性、灵活性及可扩展性,能处理复杂模式识别与预测任务,适用于不同类型与规模的神经网络,显著提升了模型的预测准确性和泛化能力。
WK
16 3
|
2月前
|
存储 人工智能 供应链
AI赋能电商中小企业的三大制胜策略
AI赋能电商中小企业的三大制胜策略
AI赋能电商中小企业的三大制胜策略
|
2月前
|
人工智能 iOS开发 UED
详解苹果和微软的AI集成策略
详解苹果和微软的AI集成策略
详解苹果和微软的AI集成策略
|
1月前
|
人工智能 运维 自然语言处理
AI战略丨构建未来: 生成式人工智能技术落地策略
GenAI 的技术落地需要企业进行周密地规划和持续地努力。企业必须从自身的战略出发, 综合考虑成本、效果和性能,制定合理的技术架构,通过全面的 AI 治理,实现可持续的创新和发展。
|
9天前
|
机器学习/深度学习 人工智能 开发框架
智能ai量化高频策略交易软件、现货合约跟单模式开发技术规则
该项目涵盖智能AI量化高频策略交易软件及现货合约跟单模式开发,融合人工智能、量化交易与软件工程。软件开发包括需求分析、技术选型、系统构建、测试部署及运维;跟单模式则涉及功能定义、策略开发、交易执行、终端设计与市场推广,确保系统高效稳定运行。
|
2月前
|
机器学习/深度学习 人工智能 算法
AI入门必读:Java实现常见AI算法及实际应用,有两下子!
本文全面介绍了人工智能(AI)的基础知识、操作教程、算法实现及其在实际项目中的应用。首先,从AI的概念出发,解释了AI如何使机器具备学习、思考、决策和交流的能力,并列举了日常生活中的常见应用场景,如手机助手、推荐系统、自动驾驶等。接着,详细介绍了AI在提高效率、增强用户体验、促进技术创新和解决复杂问题等方面的显著作用,同时展望了AI的未来发展趋势,包括自我学习能力的提升、人机协作的增强、伦理法规的完善以及行业垂直化应用的拓展等...
160 3
AI入门必读:Java实现常见AI算法及实际应用,有两下子!
|
2月前
|
机器学习/深度学习 人工智能 PyTorch
面向AI Native应用的高效迁移学习策略
【8月更文第1天】随着人工智能技术的发展,越来越多的应用场景需要定制化的AI解决方案。然而,从零开始训练一个深度学习模型往往需要大量的标注数据和计算资源。迁移学习提供了一种有效的方法来解决这个问题,它利用预训练模型的知识,通过少量的数据就能达到很好的性能。本文将深入探讨面向AI Native应用的高效迁移学习策略,并通过实例展示如何针对具体场景进行模型微调。
199 6
面向AI Native应用的高效迁移学习策略
|
2月前
|
存储 人工智能 算法
AI算法的道德与社会影响:探索技术双刃剑的边界
【8月更文挑战第22天】AI算法作为一把双刃剑,在推动社会进步的同时,也带来了诸多道德与社会挑战。面对这些挑战,我们需要以开放的心态、严谨的态度和创新的思维,不断探索技术发展与伦理规范之间的平衡之道,共同构建一个更加美好、更加公正的AI未来。
下一篇
无影云桌面