随着硬件条件的不断发展和算法理论的不断进步,深度学习已经成为解决实际问题的一种有效方法,特别是在图像处理方面,深度学习能够帮助我们解决很多历史上难以解决、或者解决不好的问题。这篇博客代理大家梳理相关知识,搞明白由图像处理出发,我们为什么要学习深度学习?如何学习深度学习?最后落到实处,应该是研究那些具体的东西?
目前方向:图像拼接融合、图像识别 联系方式:jsxyhelu@foxmail.com
一、为什么研究深度学习
深度学习是有史以来发明的最为优美的编程范式之一。在传统的方法中,我们告诉计算机做什么?把大问题分解成许多小的、精确定义的问题,通过计算机强大的计算能力,得出解析解或者近似解,从而辅助现实生活中很多问题的解决。而这个思路的瓶颈显而易见就是我们的建模和编码能力——如果计算机理解的问题是不正确的、不完善的,那么它肯定无法获得准确的解释。而深度学习则是提供了系统的方法,来提取系统中的最优特征,并且直接引导模型的建成。
1、今日深度学习的理论成熟、硬件支持已经比较完善




并且在传统问题上获得更好的成功率:图像分割、图像识别、图像增强……
2、图像处理和深度学习结合紧密,
深度学习已经成为CV研究的标配
第一,“一图顶千言”,图像、视频数据本身就是天生的“大数据”,并且数据和数据之间“强相关”,适合深度学习算法进行研究;此外,传统的图像处理任务非常适合在深度学习领域迁移。
第二,深度学习算法的通用性很强,刚才提到的检测,在传统算法里面,针对不同的物体需要定制化不同的算法。相比来看,基于深度学习的算法更加通用,比如faster RCNN在人脸、行人、一般物体检测任务上都可以取得非常好的效果。
第三,深度学习获得的特征(feature)有很强的迁移能力。所谓特征迁移能力,指的是在A任务上学习到一些特征,在B任务上使用也可以获得非常好的效果。例如在ImageNet(物体为主)上学习到的特征在场景分类任务上也能取得非常好的效果。
3、研究百花齐放,落地仍需时间
各行各业已经积累了丰富的数据,论文能够实现得到非常好的效果,但是由于成本、功耗、理念
等问题,深度学习技术
落地应用需走向垂直化——有着丰富的市场前景,强烈的需求。
二、怎样学习
学习是因人而异的,但是重点是有共性的,特别是深度学习的曲线肯定比较陡峭,并且受限于资源等多方面因素,一点要注重时刻总结反思,勤奋探索:
1、打好基础。能够理解神经网络乃至深度学习的基本思路,比如SGD,不仅要能够理解,而且要能够编码;
2、基本的Python编码能力,因为这块调试的时候系统影响比较大,很多变量是不可见的,所以必须要能够有比较好的编码能力;
3、运用先进工具,我们使用kares和colab解决相关问题;
4、不断学习、反思、交流。兼容并包。
5、专注于实际运用、算法的落地。
分享我的学习研究图谱
产出&创建解决实际问题的项目 |
|||
DeepFakes换脸 |
以图搜图CBIR系统 |
AutoML |
视频识别 |
LEW数据集人脸识别系统实验 |
ImageNet图像分类实验 |
ImageNet图像分割 |
纹理合成StyleTransform |
Mnist系统实验 |
RCNN |
VGG |
GoogleNN |
Keras基本知识 |
|||
Network2可控可理解小型网络 |
Kares+Colab(可运行GPU网络) |
||
Python、Numpy等语法和程序设计基本环境 |
三、现在开始,学习那些东西
首先要解决的是基础问题;
1、
Python
、
Numpy
等语法和程序设计基本环境;
2、基本程序设计和训练环境的搭建,包括单机和联机的;
3、dl的基本原理,SGD为主;
4、kares解决基本训练问题。
关键是提升思路,这样我们心里有基础,手里有工具,眼睛里能够看到问题,才能脚踏实地地区解决现实的问题,提升自己的价值。
目前方向:图像拼接融合、图像识别 联系方式:jsxyhelu@foxmail.com