今天要去清华听LeCun演讲?你需要这份笔记(另附:视频+PPT)

简介:
本文来自AI新媒体量子位(QbitAI)

 这张票有点抢手

早就没票了。

今天下午,Facebook人工智能研究院院长Yann LeCun,将在清华大礼堂主讲一场两个小时的讲座,题目是《深度学习与人工智能的未来》。

如何优雅的听好LeCun的分享?

当然是提前预习。还能预习?当然,其实可以把LeCun的演讲当成一个巡演。很少有明星在巡演的过程中发表全新的主打歌,这放在人工智能领域也一样。

同理,LeCun这次不可能在清华发表一次全新的分享。所以,如果能事先预习一下,对于在现场理解和学习肯定是大大的加成。

去哪儿找预习的内容?

别担心,量子位都给你准备好了。我们不单给你找到了LeCun此前同题分享的视频,而且还找到了一份高质量的学习笔记……贴心不?

这个笔记的作者Valerian Saliou,是Crisp公司的CTO,也是一个全栈工程师。这份《听LeCun分享后有感》的笔记,发布于去年10月27日。

哪怕你没搞到票,现在也不用着急了。因为LeCun要讲的主体思想(为什么感觉这个词怪怪的)是一致的。视频和笔记,这里都齐了。

当然能去现场最好,有票不去的同学,可以把票转给量子位……

视频

好吧,先把视频放出来。我们顺便也把YouTube自动配的英文字幕下载了,有需要的同学,可以在量子位微信公众号( ID:QbitAI )对话界面,回复“字幕”两个字即可获得。


笔记

然后,笔记的环节来了。再次感谢Valerian Saliou。

感知器:第一个学习机器

  ■ 我们今天使用的机器学习算法是感知器的后代

  ■ 加权总和,误差校正

   · 如果输出太低,增加所有输入为正的权重,并减少所有输入为负的权重

   · 如果输出太大,那就反过来做

  ■ 监督学习

   · 一个训练集

   · 一些例子,如果机器出错(或正确),你得调整权重

   · 模式识别的标准模型,从50年代至今都是“the only model in town”

   · 监督机器学习=功能优化

   · 随机梯度下降,意即针对某一案例,给予机器期望的答案并调整超参数,使得误差减小

   · 如何构建复杂的机器?如何推而广之,例如图像识别

  ■ 深度学习系统

   · 有数以亿计的“旋钮”

   · 每个识别需要数十亿次操作(输入到输出),所以使用GPU,而不是CPU

   · 搭建深度学习系统,不是单一模块,而是级联的模块

     1、特征提取器

     2、中级特征

     3、高级特征

     4、可训练分类器

   · 所有层(即模块)均可训练

   · 深度学习中深度的意思是有很多层

   · 图像由图案/对象组成,继续分解为各个部分,继续分解为像素

     · 低级特征探测像素

     · 中级特征探测部分

     · 高级特征探测图案/对象

   · 不仅对图像有效,还能用于文本、语音等。让世界变得可理解

   · 大脑的新皮层也是分层的

     · 中脑腹侧/识别路径也有很多层

     · 非常快(识别对象的过程需要不到100ms)

     · 反馈和推理对解释日常对象的影响非常小

多层神经网络

  ■ 反向传播算法

  ■ 用向量乘以矩阵

  ■ 阈值操作(非线性),例如:ReLU(x) = max(x,0)

  ■ 每个单元计算其输入的加权和

  ■ 加权和通过非线性函数传递

  ■ 学习的算法改变权重

  ■ 如何训练?

    · 使用反向传播算法

    · 框架:Torch,TensorFlow,Theano等

    · 雅可比矩阵(包含所有偏导数输出)

    · 将梯度乘以雅可比矩阵

  ■ ReLU:修正线性单元

卷积神经网络

  ■ 缩写:ConvNets或CNN

  ■ 网络中有两种层

    · 卷积

    · 池化

  ■ 针对AI工作的改进

    · ImageNet数据集,具有120万个标记的训练样本和1000个类别

    · NVIDIA CUDA,万亿op/s

    · 卷积的网络获取信任,然后人们都转向ConvNets

  ■  极深卷积网络架构

    · VGG

    · GoogLeNet

    · ResNet

  ■ 使用极深卷积网络

    · 解释图片

    · 人脸识别

    · 分类+定位(多尺度滑动窗口),用于识别人体在图片上的姿势

    · Big Sur:Facebook的深度学习引擎,由一堆GPU组成

     (量子位注:现在升级成Big Basin了,见报道

    · 由于最近有更多人研究深度学习,所以进步加快了

可微分内存

生成对抗网络

  ■ DCGAN:https://[github.com/Newmu/dcgan_code](http://github.com/Newmu/dcgan_code)

P.S. 还有一份补充材料送给同学们:《LeCun详解预测学习:一小时视频+84页PPT

欢迎加量子位小助手的微信:qbitbot,如果你研究或者从事AI领域,小助手会把你带入量子位的交流群里。

本文作者:若朴
原文发布时间: 2017-03-22 
相关文章
|
监控 物联网 Windows
MQTT常见问题之mqtt自动断开了连接如何解决
MQTT(Message Queuing Telemetry Transport)是一个轻量级的、基于发布/订阅模式的消息协议,广泛用于物联网(IoT)中设备间的通信。以下是MQTT使用过程中可能遇到的一些常见问题及其答案的汇总:
|
1月前
|
人工智能 Cloud Native API
从零到一:如何通过 OpenClaw 快速构建企业级专属 AI Agent 指南
阿里云OpenClaw是云原生大模型应用开发平台,提供低代码编排、强大RAG引擎、弹性架构与丰富插件,助企业快速构建深度耦合业务数据的专属AI Agent,降低大模型应用开发门槛。
421 1
|
2月前
|
人工智能 自然语言处理 前端开发
AI生成网站的技术架构解析:前端、后端与部署逻辑
本文解析AI生成网站的底层技术架构,涵盖前端(语义解析→组件抽象→代码生成)、后端(自动建模、API与鉴权生成)及部署(构建、打包、一键发布)三层逻辑,揭示其本质是开发抽象层级的跃升——从写代码转向描述需求,赋能快速验证与高价值创新。
|
4月前
|
vr&ar
观海微电子---AF、AG、AR 的差别和作用
AF、AR、AG镀膜技术分别实现抗指纹、增透防反射、防眩光功能。AF疏水防污,适用于屏幕;AR提升透光率,用于光伏、汽车玻璃;AG漫反射降反光,广泛应用于电子显示与文博领域。
|
4月前
|
人工智能 算法 搜索推荐
【经验分享】非技术岗小白的CAIE持证实录:从焦虑转型到技能变现,这些真心话只说给你听
先自报家门:汉语言文学专业,做了两年行政岗,每天被会议纪要、文件归档占满时间,看着身边人要么升职要么转去热门行业,焦虑到整夜失眠。偶然刷到AI岗位的招聘信息,薪资比我当时高一半,但“算法基础”“编程能力”这些要求直接把我劝退。直到发现CAIE注册人工智能工程师认证,说是不限制专业和基础,抱着“死马当活马医”的心态试了试,现在不仅顺利拿到一级证书,还成功转岗AI运营,薪资涨了30%。今天不搞虚的,把备考到持证的全流程干货和真心话都分享出来,希望能帮到和曾经的我一样迷茫的人。
|
4月前
|
SQL 监控 安全
构筑第一道防线:WAF防火墙规则配置与CC攻击防御实战
在数字化时代,Web应用安全至关重要。本文深入解析WAF核心规则配置,涵盖基础防护、智能语义分析与访问控制,构建纵深防御体系。聚焦CC攻击,提出从流量基线、精准防护到人机验证的实战方案,结合阿里云WAF功能,实现可调优、可持续演进的智能防护,助力企业筑牢应用安全防线。(238字)
|
9月前
|
网络协议 算法 JavaScript
快手虚拟ip地址永久免费版分享
虚拟IP技术原理与实现方案 1. 虚拟IP核心概念
|
存储 运维 安全
Github Action:让静态网站实现定时发布
本文探讨了静态网站实现定时发布的解决方案,针对静态博客缺乏原生定时发布功能的问题,作者基于Zola工具构建的静态网站,最终选择通过GitHub Action实现定时发布。文章对比了几种实现方式,包括人力、自建服务及平台原生功能等,指出最理想的是利用平台能力但多数平台缺乏该功能。文中详细介绍了GitHub Action方案的原理、部署过程和使用流程,并分享了高级配置如推送通知。同时分析了方案的局限性,如时间颗粒度粗、设置繁琐等,并提出改进建议。总结中展望了未来优化方向,旨在提升静态网站维护体验。
263 0
|
算法 API 开发者
1688拍立淘接口搜索相似商品的实现方法
1688推出的拍立淘图片搜索功能,允许用户通过上传图片快速找到相似商品,极大提升购物体验。该API接口支持开发者集成图像搜索功能,提供商品管理、竞品分析等服务。接口采用HTTP POST请求,上传图片并返回相似商品列表,包括名称、价格、销量等信息。Python示例代码展示了如何使用该接口进行图片搜索。供稿者:Taobaoapi2014。
|
存储 安全 JavaScript
浏览器的同源策略
【10月更文挑战第31天】浏览器的同源策略是浏览器安全模型的重要组成部分,它通过限制不同源之间的资源交互,有效地保护了用户和网站的安全。开发者在进行Web开发时,需要充分理解和遵循同源策略,同时合理地运用各种跨域技术来满足业务需求,确保网站的安全性和功能性的平衡。
466 2