更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud
深度学习的概念源于人工神经网络的研究,如果追溯深度学习的概念还是要回到2006年Hinton那篇论文,基于深信度网(DNB)提出非监督贪心逐层训练算法,未解决深层结构相关的优化难题出现的论文。
其实,对于我们人类而言,很多事情都是经过大脑的深层处理模式的解决的,笔者认为,在未来广度学习一定是深度学习的一个沿伸,为什么?因为人类最显著的特征并不是深度学习,而是广度学习。所谓的广度学习是建立在一系列深度学习的基础上的,广度学习通俗的说法既是联想能力。
联想能力对于人类来说是非常重要的能力,一个领域的解决方法扩展到另外一个领域这种思维方式,在我们人类来说是非常普遍的。但是,对于技术来说,这些能力还需要很长的路来走,起码一点,就是深度学习必须达到非常高的程度。因为之后这样深度学习才能真正的应用于强人工智能,强人工智能要求的就是人工智能具有联想能力,一旦强人工智能具备了强人工智能的基础,那么强人工智能一定会从梦想成为现实。
深度学习实战篇:
1. 间谍卫星的基础?YOLT——利用卷积神经网络对卫星影像进行多尺度目标检测
摘要:利用卷积神经网络(CNN)对卫星影像进行多尺度目标检测,该文是在YOLO模型的基础上改进提出YOLT模型,该方法极大的提高了背景区分,并能够在不同尺度和多个传感器上快速检测出物体。
摘要:Yann Lecun曾将无监督学习比作蛋糕,将监督学习比作蛋糕上的糖霜,声称我们仅懂得如何做糖霜却不知道怎样才能做出蛋糕。在本篇文章中,我们提供了一份训练无监督学习算法的“蛋糕”配方,用来增强卫星图像。
3.日常新闻能用来精准预测股市动向吗?这篇聚焦开放数据的访谈或能给你答案
摘要:日常新闻标题能用来精准地预测股市动向吗?在本次聚焦开放数据栏目中,Jiahao谈论了作为一名教师在Kaggle开放数据分析平台上共享数据集的理由,迄今为止Kaggle用户实现的一些重大的基准预测,以及他对基于新闻标题实现交易算法的可行性的看法。
摘要:神经网络是机器学习中的热门话题。但是网络上有关LSTM在时间序列上的应用却很少,我们不妨透过本文来开拓LSTM的应用视野。
摘要:如今,Twitter、Tumblr和Facebook等社交网站深受互联网用户欢迎。在这些热门网站上,每天都有数以百万的消息产生。这些消息的作者记录自己的生活,分享对不同话题的看法,并讨论当前的问题。此类网站已经成为人们评论与情感信息的宝贵来源,这样的数据能够有效地用于营销或社交研究。
6. 一次神经网络的探索之旅-基于Tensorflow的路标识别
摘要:是否觉得理论的神经网络有点抽象呢?是否想知道神经网络具体是怎么应用呢?本文将一步一步引领你完成一个基于TensorFlow的交通路标识别项目。还等什么呢,快来看看吧。
摘要:在你的工作时间,有没有上网浏览一些与你工作无关的网站呢?每当这种时候,如果我发现老板不知何时已经站在我背后时,我会感到非常尴尬。当然,我可以迅速地切换屏幕,但这种行为实在是太可疑了,更何况有时我都不会注意到他已经在那了。所以,为了解决这个问题,我创建了一个使用Keras的系统,它能自动识别我
8. GitHub网站究竟可不可靠?谷歌工程师教你用BigQuery一探究竟
摘要:GitHub的可靠性有没有达到SLA的要求?网站近期的SLO又如何?有了GitHub的网站日志以及BigQuery工具的帮助,我们可以更加深入地定义并度量这些指标。在本篇文章中,作者结合Github公开的部分数据,使用BigQuery以及一系列数据可视化方法对Github网站的可靠性展开了分析。
摘要:根据代码识别编程语言的源代码分类器将是一个非常有用的工具,因为它可用于在线自动语法高亮和标签建议,比如可用在StackOverflow和技术维基网站上。这个想法促使我们根据最新的AI技术编写一个对代码片段依据编程语言进行分类的模型。
摘要:本文介绍了仿射变换和双线性插值在图片变换中的应用。
11.DeepTraffic: 如何让MIT的游戏利用深度学习来减少交通阻塞
摘要:大家都对交通阻塞深恶痛绝。除了让人头疼和错过约会之外,交通拥堵让美国的司机每年多花3000亿美元。研究人员建议大家使用自动驾驶汽车,即使数量占比并不大,但也能大大改善交通拥堵情况。 Lex Fridman和他的MIT团队开发了一款模拟游戏来加速实现这个未来。
12. 私人定制——使用深度学习Keras和TensorFlow打造一款音乐推荐系统
摘要:还在为虾米音乐等APP的精准推送感到惊奇嘛?快来瞅瞅,自己也可以私人定制一个音乐推荐系统啦。本文利用深度学习打造一个音乐推荐系统,处理起来不是很复杂,主要是先收集音乐制作成一个音乐库,然后对音乐进行处理转换成相关的频谱图,不同类型的音乐对应不同的频谱图,之后利用这些频谱图训练搭建的卷积神经网络模型,以此实现后续的音乐推荐。
摘要:我们可以创建一个能够对交通标志进行分类的模型,并且让模型自己学习识别这些交通标志中最关键的特征。在这篇文章中,我将演示如何创建一个深度学习架构,这个架构在交通标志测试集上的识别准确率达到了98%。
摘要:学了那么多深度学习的基本知识,还在发愁没有地方展示自己学过的知识?来试试这个简单的实际问题吧!
摘要:本文探讨的是开发一个能够对心脏磁共振成像(MRI)数据集图像中的右心室自动分割的系统。到目前为止,这主要是通过经典的图像处理方法来处理的。而现代深度学习技术有可能提供更可靠、更自动化的解决方案。
16. 对象跟踪小白?本文带你玩转OpenCV(C ++ / Python)
摘要:本文中我们将学习OpenCV 3.0中引入的OpenCV跟踪API,以及学习OpenCV 3.2中提供的6种不同的跟踪器。
摘要:OCR也算是计算机视觉的一部分,今天我们来介绍一下如何使用(opencv/python)来实现OCR处理银行票据。
深度学习杂谈篇:
1. 深度学习都需要了解什么?无从下手的话,可以看看这份深度学习速查表
摘要:本文介绍了一些深度学习中的常见概念,如梯度、后向传播、ReLU、Dropout、交叉熵与softmax等,以帮助大家快速了解深度学习。
2. 最前沿:图文结合详解深度学习Memory & Attention
摘要:该文献主要介绍深度学习网络中语音、文字以及图片这块中的典型神经网络,重点介绍Memory与Attention的发展前沿,分析了几个详细的典型模型,说明Memory与Attention在文字、语音以及图片相关应用中的重要性。
摘要:本文简单介绍了 Goodfellow 所著的《深度学习》的主要内容,非常透彻地分析了该书的优缺点以及适用群体。想学习深度学习么?快来看看吧。
摘要:本文是一篇关于深度学习的入门笔记,简单的介绍了神经网络的结构,包含输入层、隐藏层以及输出层;介绍了前向传播过程以及反馈传播过程。深度学习的优点在于其能够将复杂的模式分解成一系列更简单的模式,缺点是训练所花费的时间以及受到计算机运算能力的限制等。
摘要:本文是一篇关于深度学习的入门笔记,简单的介绍了几种神经网络的基本结构以及原理,包含受限玻尔兹曼机、卷积神经网络、循环神经网络等;介绍他们的训练的基本过程,并说明各自应用领域,适合深度学习研究者的入门理解。
摘要:本文描写了百度硅谷人工智能实验室在深度学习框架中引入HPC技术的实践,通过对OpenMPI里ring all-reduce算法进行改进,使语音识别训练模型的性能得到数十倍的提升,最后百度开源了其实现,希望更多的人受益。
7. Top 100论文导读:纯干货!深度神经网络中的理解,泛化以及迁移学习
摘要:作者从目前热门的top 100 优秀深度学习论文中选取第一组论文为大家进行纯干货总结,该组包含6篇论文,主要讲解使用可视化技术分析深度神经网络DNNs(大多是卷积神经网络CNNs)学习的东西,泛化性以及迁移学习。
摘要:本文介绍了关于对抗样本的7篇文献,解释了对抗样本的产生及攻击原理,对深层神经网络会有什么影响等。结果表明,即使是训练得非常好的神经网络在对抗样本前会显得那么脆弱,不过我们可以通过利用对抗样本进行对抗训练以提高模型的努棒性。
摘要:线性代数在深度学习领域有着举足轻重的作用,它是深度学习各种算法的基本数学工具。本文作者对深度学习中会用到的一些线性代数的基本概念和运算操作进行了介绍,希望能让有兴趣的同学一起来进行学习。
摘要:在深度学习过程中,你或许会碰到一般近似定理:仅含有一层的前馈网络足以有效地表示任何函数,但是这样的网络结构可能会格外庞大,进而无法正确的学习和泛化。这是一个令人惊奇的观点。如果你可以接受大多数种类的问题都可以约化成函数,那么这句话就是说,神经网络可以在理论上解决任何问题。
摘要:随机性在深度学习中有多么重要?这篇文章或许能给你答案。
12. 大神带你分分钟超越最好结果——基于分布式CPU计算的Deeplearning4j迁移学习应用实例
摘要:本文通过应用开源工具Apache Spack、Apache Hadoop和Deeplearning4j以分布式CPU运算完成VGG16模型迁移学习的应用,在Caltech-256数据集上实现了最好结果。
摘要:文章简要概述了一个深度学习的开源库,文末有这个开源库的地址。
摘要:世界上没有完美无缺的技术,深度学习也是如此。本文着重向我们介绍了深度学习发展的六大障碍!
摘要:任何技术的入门都是第一只出现的拦路虎,对于初学者来说,工具的安装着实让人头疼。本文作者介绍如何使用Ubuntu入门深度学习的教程,Python版。
摘要:本文列举了一些常用的深度学习的训练技巧,对这些技巧进行简单的介绍并说明它们的工作原理。涉及范围广,适合深度学习各领域的研究者。
摘要:作者为了搭建了一个基于Ubuntu和Nvidia的深度学习计算机,阅读了大量的文档来了解细节和规范,并把所做的所有工作整理并记录了下来。
深度学习竞赛篇:
摘要:数据科学竞赛平台Kaggle将举办一场为期五个月的AI竞赛,这场竞赛将展示未来网络安全和网络战争的样子,而战争中的攻守双方都是AI算法,它们将互相迷惑互相欺骗,以研究如何加强机器学习系统来抵御未来可能出现的攻击。
摘要:本文总结由Marios Michailidis(a.k.a Kazanova),Kaggle Grandmaster在2016年3月5日现在排名第3位的在线研讨会上分享的技巧,更好地在机器学习竞赛中取胜
摘要:本文总结由Marios Michailidis(a.k.a Kazanova),Kaggle Grandmaster在2016年3月5日现在排名第3位的在线研讨会上分享的技巧,更好地在机器学习竞赛中取胜
4:5个步骤 & 7个提示 | 一份开启Kaggle竞赛征途的初学者指南
摘要:本文是关于Kaggle数据科学竞赛平台的初学者指南,总结出五个步骤和七个提示。其中五步骤介绍了由浅入深地慢慢适应Kaggle竞赛,七个提示让初学者能够享受在Kaggle平台上的一切。最后强调,通过Kaggle平台着重锻炼提示自己的职业技能,而不是看中竞赛的奖金。
5.Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南
摘要:本文是一个入门介绍,由Kaggle首席技术官Ben简单介绍以下2017年的NIPS 对抗学习竞赛数据的处理,用一个具体的代码实例介绍了如何生成目标对抗图像与非目标对抗图像,将对抗图像送入原先的分类器中,可以看到结果与原图大相径庭。
摘要:正则表达式被用来定义文本的格式,而深度学习则被广泛应用在语音识别,机器翻译,计算机视觉等方面。当它们结合起来,会迸发出怎样的火花呢?
摘要:梯度提升方法(Gradient Boosting)在众多机器学习竞赛中有着广泛的应用。本文介绍了梯度提升的基本概念,并结合实例讨论了梯度提升方法在实践中应用。
摘要:针对Kaggle保险索赔竞赛给定的数据集,本文详细介绍了如何利用python对数据集进行分析并对特种进行预处理操作。以保险索赔竞赛案例和详细的操作步骤,生动形象的讲解了自动预测保险索赔的算法流程。
摘要:本文介绍了深受Kaggle数据分析竞赛参赛者欢迎的一个梯度提升算法实现-XGBoost,在分类算法中,XGBoost以速度制胜,精度与Sci-Kit Learn相当,在Kaggle竞赛中打败了AdaBoost(自适应提升算法)和RandomForest(随机森林算法)。
10. 干货|大神教你如何参加kaggle比赛——根据CT扫描图预测肺癌
摘要:本文介绍Deep Breath团队在kaggle竞赛上取得第九名使用的方法,主要包括数据处理以及相关针对数据处理的不同网络架构的搭建,最后说明了kaggle竞赛的一些注意事项。
本系列博客内容由北邮@爱可可-爱生活老师推荐,@阿里云云栖社区组织翻译,翻译小组袁虎负责整理,校审:主题曲哥哥。本系列长期更新,更多关于深度学习优质好文,多多推荐!