如何自学图像编程

简介: 现在,图像类信息越来越多了,对图像的编程需求也越来越多。图像类项目的特点是性价比高,单行代码的价格一般是普通的程序的10倍,每行代码能够卖几块钱。很多人把目光放在这个上面。刚才又有网友咨询,做图像要看些什么书?结合我的自学经验,写一篇博客谈谈这个问题。

现在,图像类信息越来越多了,对图像的编程需求也越来越多。图像类项目的特点是性价比高,单行代码的价格一般是普通的程序的10倍,每行代码能够卖几块钱。很多人把目光放在这个上面。刚才又有网友咨询,做图像要看些什么书?结合我的自学经验,写一篇博客谈谈这个问题。
 
 需要先明确几个问题:
 (1)你的基础如何?做图形图像的话,对数学要求比较高,至少要有大学数学的基础——微积分、线性代数、概率统计和数值分析都会用到的。不然,书看不下去,没法自学。如果要做深入的话,对英语也有一定的要求,绝大部分深入的资料都是英文的。

 (2)做哪个层面的?与硬件严重相关的只能选C,做应用层的话可以选C++和C#,我个人推荐C#,当然,智能手机还是推荐C++。做Web层面的话,目前最佳选择是Flash(其实Silverlight比Flash更适合做Web图像,好歹Silverlight有byte类型,有struct,但Silverlight的普及度不够),Html5/Canvas目前只能做简单的应用,复杂的还不行。如果只是做算法,matlab就够了,但一般不是科班出生,很少做纯算法的。做纯算法还有个缺点就是,算法转换为收入很难。鉴于C#写算法并不比用matlab写算法慢,不建议摸matlab。但matlab代码要能看懂,因为论文中很多算法是用matlab写的。

 (3)有没有克服困难的勇气。图像类项目大多不大,普遍的几千行代码就可以搞定。就这几千行代码,难度越大的钱越多。关键词就是困难和难度,工作量往往不是问题。也就是说,你越牛逼,越值钱。牛逼是没有止境的,不像那些靠体力的项目,身体是个硬的限制。

 下面的书籍,如果是写的英文名字,那就是推荐阅读英文版,如果是中文名字,那就说明,中文版写的/翻译的也不错,推荐看中文版而非英文版。都是可以直接下载到的或买到的。
 
 首先是两本核心书籍:
 (1) Image Processing,Analysis and Machine Vision 3ED。(中文名:《图像处理、分析与机器视觉》)
 (2) Computer Vision: Algorithms and Application(中文名:《计算机视觉——算法与应用》)

 第一本书偏重于基础,但是它写的可不基础。写的很简且信息量极大,但核心概念都讲了,重点算法大部分都列出来了。第二本书偏重于工程应用,概述了各个领域的有效算法,点到为止。
 如果看第二本没困难的话,可以忽略掉第一本。第一本书也不好读,一上来就讲了狄拉克分布,因此,要想从头到尾都看懂是几乎不可能的,但是它的内容的前后依存性不大,看不懂的直接略过去就行了,只看能看懂的即可。
 没必要看完,我也只看了30-40%感兴趣的部分,其它的要么是不感兴趣的,要么是看不懂的。
 只需要大学数学基础就可以开始看,能看懂部分就可以做项目了。找到和项目相关的内容,找到相应的参考文献,直接去看论文实现论文的算法即可。绝大部分重要论文Google Scholar都能搜到原文,如果英文水平不够,也可以在几个期刊网搜中文的论文,不是特别前沿的东西,中文的论文也有涉及到的。
 看书的重点是理解,理解算法最佳方式是自己把算法写一遍。可以参考OpenCV的代码来写。理解一个算法之后,这个算法就可以为你赚钱,不理解,是很难用对算法的。自己写算法。你才对这个算法的性能有直观的感受,知道可以通过哪些方式来改进它,知道怎么在性能和算法效果之间进行取舍,这对项目来说,是很重要的。
 不建议买第二本书的中文版,它的中文版阉割了参考文献和索引这两个最有使用价值的部分。
 
 把这两本书全部看完吃透,单靠大学水平的数学是不够的,至少得数学系本科生级别的知识储备。如果大学数学忘了,建议先复习一遍。
 自学推荐:
 (1)陈天权版《数学分析(一、二、三)》。这是国内最难的一套数学分析教材,为什么推荐它呢?它自成条理,信息量丰富,把图像分析深入所需的数学内容都包括进去了:微积分、点集拓扑、实分析、泛函、变分、复分析、流形……,重要概念都讲了。学完了,看论文问题不大。缺点就是难。可是,图像类项目的特点也是难。遇难而上是必须的。这套书虽难,但是思路极其清晰,就是看的慢一点而已。要知道,计算机所能发挥出的威力只是数学理论的一部分,随着计算机的计算能力越来越强,越来越多的数学方法会引入到程序中来,对于图像分析领域尤其如此。所以要未雨绸缪,别看有的数学知识现在用不上,说不定哪天就用到了。
 (2)Lax的《线性代数及其应用》。作者是沃尔夫奖得主,写的很简洁明要,且不与大学学的线性代数重复。
 (3)《Numerical Recipes》。数值分析有这一本书就够了,秒杀众书的书。这本书只看感兴趣的或当前用到的即可。

 

 鉴于图形和图像的关系越来越紧密,关于图形学的书籍也是值得一读的。推荐两本:
 (1)David F.Rogers的《计算机图形学的算法基础》。这本书实在是太经典了,就是有点老,比较基础。
 (2)《实时计算机图形学》这本书讲的都是比较现代的,正好结合上一本看。

 

 图像编程 = 算法 + 性能。因此,性能优化方面也得看。比如这本:《软件优化技术--IA-32平台的高性能手册》。
 
 会用Photoshop对图像编程很重要。Photoshop有强大的编辑功能和特效库,很多时候,可以用Photoshop先进行预研究,确定项目是否可行。可行的话,我们再把Photoshop的操作过程用算法来实现,实际项目中,经常会这么操作的。 Photoshop 推荐一本书:李金明、李金荣的《Photoshop CS5完全自学教程》。这本书写的非常棒,就是书名有点土,和那些垃圾书的书名很像。
 
 如果用C/C++的话,推荐《学习OpenCV(中文版)》,翻译的不错。如果用C#的话,没啥好书可以推荐,可以看看我博客中的文章。如果用Flash的话,推荐《Foundation ActionScript 3.0 Image Effects》。
 
 如果做的是和彩图有关的话,推荐《彩色数字图像处理》。其它的,《图像局部特征不变性特征与描述》写的也不错。
 
 ====
 下面举个例子讲讲工具、知识间的综合应用。
 要实现一个lemo特效,可以先利用现有工具得到像素之间的映射图(比如我这篇文章:《解决问题的艺术:半小时编程实现照片的反转负冲特效 》)。但这样一来,每种特效都需要一个像素映射图,增大了程序的尺寸,怎么办呢?
 一种方法是用Photoshop模拟它,然后,写图像处理算法来重复这一过程。这是用图像处理的方法来解决问题。
 另一种方法是将lemo特效当作一多元函数,特效前的图像是输入值,特效后的图像是输出值,先写出一个自由度高点的函数,再采用拟合的方法,找到合适的函数参数,然后检验这个函数的稳定性,靠谱的话就是它了。这是用数学的方法来解决问题。

若标题中有“转载”字样,则本文版权归原作者所有。若无转载字样,本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利.
目录
相关文章
|
3月前
|
设计模式 存储 算法
探索代码之美:编程中的艺术与科学
【10月更文挑战第37天】在数字世界的画布上,每一行代码都是艺术家的笔触,每一个算法都承载着科学的灵魂。本文将带你走进编程的内在世界,探索那些隐藏在逻辑背后的魅力,揭示如何通过技术提升个人能力,以及如何在技术的海洋中找到自己的北极星。从基础的数据结构到复杂的软件架构,我们将一起领略编程的艺术与科学。
|
5月前
|
算法 开发者 Python
探索代码之美:从小白到大师的编程旅程
【9月更文挑战第15天】本文将带领读者走进编程的世界,从最初的困惑与挫败,到逐步掌握编程技能并发现其乐趣。我们将通过具体案例和代码示例,展示如何从基础语法学习,到解决实际问题,再到优化代码的过程。这不仅是技术上的提升,更是一个思维和解决问题能力成长的故事。无论你是编程新手还是有一定经验的开发者,这篇文章都将为你提供有价值的见解和启发。
|
5月前
|
算法 Python
揭秘Python编程之美:从代码到艺术的转变
【9月更文挑战第1天】 在这篇文章中,我们将一起探索如何将看似枯燥的Python编程代码转变为一门充满创造性和美感的艺术。通过深入浅出的解释、生动的例子和实用的技巧,你将学会如何编写更加优雅、高效且易于理解的Python代码,从而提升你的编程技能并享受编程的乐趣。
50 2
|
6月前
|
搜索推荐 程序员
探索代码之美:一段编程旅程的启发与感悟
【8月更文挑战第30天】编程,这个听起来有些高冷的技能,实际上就像绘画或音乐一样,是一种创造性的表达。它不仅仅是冷冰冰的代码和逻辑,更是情感和智慧的结晶。本文将通过一次个人的编程经历,探讨如何通过代码来解决问题、创造美,以及这一过程中的思考与成长,从而揭示编程背后的艺术性和哲学意义。
|
7月前
|
设计模式 算法 程序员
探索代码之美:编程的艺术与实践
【7月更文挑战第31天】在数字世界的构建中,编程不仅仅是一项技术工作,它更是一种艺术。本文将带领读者深入编程的核心,从基础语法到设计模式,再到软件架构,探索如何通过代码表达创造性思维和解决实际问题。我们将一起见证编程如何从枯燥的指令序列转变为优雅的解决方案,以及这一过程如何影响我们的思考方式和解决问题的策略。
|
6月前
|
算法 程序员 开发者
代码之美:探索编程的艺术与实践
【8月更文挑战第8天】 在数字化时代,编程已成为一门不可或缺的技艺。它不仅仅是一种工具,更是一种艺术形式。通过这篇文章,我们将深入探讨编程的美学原则,以及如何将这些原则应用于实际开发中,从而提升代码的质量和可维护性。文章将结合具体案例,展示优雅代码的力量,并讨论如何培养良好的编程习惯和持续学习的重要性。
54 3
|
6月前
|
设计模式 算法 测试技术
代码之美:编程的艺术与实践
在数字世界的构建中,编程不仅仅是一种技术活动,它更是一种艺术。通过探索编程的美学原则和实用技巧,本文旨在揭示如何将代码编写转化为一种创造性的过程,从而提升软件质量和开发者的满意度。文章将分享有效的编码习惯、设计模式的应用以及重构策略,帮助读者理解编程的艺术性,并在实践中加以应用。
75 1
|
6月前
|
Java 程序员 C++
从代码到艺术:我的编程之旅
【8月更文挑战第29天】这是一篇关于个人编程经验的文章,作者通过自己的经历,分享了编程的乐趣和挑战,以及编程如何改变他的思维方式。文章不仅包含技术感悟,还融入了作者的人生哲学和对未来的展望。
|
6月前
|
算法 测试技术 开发工具
探索代码之美:高效编程的艺术与实践
【7月更文挑战第52天】在数字世界的构建过程中,编程不仅仅是一门科学,更是一种艺术。本文将深入探讨如何通过高效的编程实践来提升代码质量、优化开发流程,并且分享在此过程中所获得的技术感悟。我们将从代码的简洁性、可读性和性能优化三个维度出发,分析并提出实用的编程技巧和策略,旨在帮助开发者在追求效率的同时,也能享受编程带来的乐趣和成就感。

热门文章

最新文章