数字图像处理(一) 绪论

简介: 数字图像处理(一) 绪论

本文主要通俗介绍了数字图像基础概念、图像处理技术划分、技术起源及应用场景、成像技术等

引言

什么是数字图像呢?

  数字图像:一幅图像可以定义为一个二维函数f ( x , y ) f(x,y)f(x,y),其中x xxy yy是空间(平面)坐标,而在任何一对空间坐标(x xx,y yy)处的幅值f ff称为图像在该点处的强度灰度。当x xxy yy和灰度值f ff是有限的离散数值时,我们称该图像为数字图像。数字图像由有限数量的元素组成,每个元素都有其特定位置和幅值,这些元素称为画图元素图像元素像素

为什么要有数字图像处理呢?

  这是因为:人类的感知仅限于电磁波谱的视觉波段,而成像机器几乎可以覆盖从伽马射线到无线电波的整个电磁波谱。数字图像处理能够对非人类所习惯的那些图像源进行加工。

图像处理技术划分

  AI(人工智能)主要分为感知、理解、决策三部分。而其中的理解,在图像处理和计算机视觉中被称作图像分析(或者叫做图像理解)。国际上做这个方向比较出名的就是斯坦福大学人工智能实验室(SAIL)主管李飞飞教授。而所谓的理解,就是理解图像背后的深层次含义,最终目标是像人一样,看一张老照片,可能会让你留下眼泪(所包含的信息量巨大)。现在李飞飞团队所做的成果能够理解各各物品之间的事物关系。如下图所示:

  对图像的处理也分为三个等级:低级处理中级处理高级处理

  低级处理:主要是对图片进行一些简单的操作,像降低噪声、增强对比度和图像尖锐化。降低噪声可以用滤波。图像增强的原则是处理某个给定的图像,使其结果较源图像更便于后续的操作与应用,主要解决由于图像的灰度级范围较小造成的对比度较低的问题,目的就是将输出图像的灰度级放大到指定的程度,使得图像中的细节看起来增加清晰。锐化图像特征,如:边缘(edges)、边界(boundaries)、对比度(contrast)等,使得图像获得更好的显示效果或更便于图像分析。

  中级处理:涉及诸多任务,如把一副图像分为不同区域或目标,也就是图像分割领域做的事情,以使得其更好被识别,分类,也可以称之为目标检测。说到这个就来感受一下成果:

  高级处理:也就是上文说到的理解图像,为什么理解这么难呢?因为人类都很难做到这件事情,就像一万个读者眼中,就有一万个哈姆雷特。虽然数字图像处理这一领域建立在数学和概率公式表示的基础之上,但人的直觉和分析在选择一种技术而不选择另一种技术时会其核心作用。其实整个科学领域都是这样。

技术起源及应用场景

  早在20世纪20年代就有数字图像处理这一概念,而到最近才发展迅速的根本原因是因为数字图像要求非常大的存储和计算能力,因此数字图像处理领域的发展必须依靠数字计算机及数据存储、显示和传输等相关支撑技术的发展。而计算机计算能力的提升也是现在AI发展起来的根本原因。很多技术在二十年前就有人提出来,而当代这些学者添砖加瓦将其效果做地更加惊艳。

  如上图这张月球的图片,所有信息都隐藏在像素点里面,但是你怎么提取有效信息呢?举个更加易懂的例子:

  通过墙壁漫反射的光影,重建原始画面。

  左边的是原图,中间的是漫反射图,右边的是通过漫反射图重建的图片。

文章名称:Computational periscopy with an ordinary digital camera

文章链接:https://www.nature.com/articles/s41586-018-0868-6

  计算机方法用于增强对比度,或将灰度编码为彩色,以便于解释工业、医学及生物科学等领域中的X射线图像和其它图像。图像处理技术也成功应用在天文学、考古学、生物学、核医学、法律实施(难不成是文字识别?不是很懂)、国防及工业领域。

成像技术

  说了这多数字图像处理,那图像从哪里来呢?也就是成像技术。主要有伽马射线成像、X射线成像、血管照相术、紫外波段成像、可见光及红外波段成像、微波波段成像、声波成像等等。设计太多知识,我也整不明白,各位观众老爷想了解的,自行百度关键字吧。

  说白了图像就是由一堆数字,那么当然可以由计算机直接凭空产生。这里就设计到计算机图形学,再结合图像处理,得到另外一个领域:三维建模。

参考

  1. 冈萨雷斯, R. C. ), 伍兹, et al. 数字图像处理 : 第3版= Digital Image Processing,Third Edition : 英文[M]. 2010.
  2. (4)图像增强- Part1. 对比度增强 :https://blog.csdn.net/hhaowang/article/details/87278518
  3. Saunders, C., Murray-Bruce, J. & Goyal, V.K. Computational periscopy with an ordinary digital camera. Nature565, 472–475 (2019)

我的微信公众号名称:深度学习与先进智能决策

微信公众号ID:MultiAgent1024

公众号介绍:主要研究分享深度学习、机器博弈、强化学习等相关内容!期待您的关注,欢迎一起学习交流进步!

相关文章
|
Python
一条龙操作有效解决PermissionError: [WinError 5] 拒绝访问的问题
一条龙操作有效解决PermissionError: [WinError 5] 拒绝访问的问题
2486 0
|
存储 前端开发 JavaScript
前端实现俄罗斯方块游戏(内含源码)
前端实现俄罗斯方块游戏(内含源码)
875 2
|
存储 关系型数据库 MySQL
ES和mysql的区别
ES和mysql的区别
|
传感器 监控 Ubuntu
Linux下监控CPU和GPU温度的三款命令行工具
如今,即使技术已经日新月异,但是笔记本电脑的散热还是一个常见问题。监视硬件温度可以帮助您诊断笔记本电脑过热的原因。
6747 0
Linux下监控CPU和GPU温度的三款命令行工具
|
6月前
|
人工智能 Python
这个开源、免费的国产Agent封神了!一句话搞定复杂任务
曾火爆全网的Manus因收费、限区退出中国,而今国产替代AiPy横空出世!开源免费、本地运行,无需复杂提示词,一句指令即可自动拆解任务、写代码、执行并纠错。L5级智能体,真正实现全自动工作流,效率跃升新境界。
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
拔俗AI人工智能评审管理系统:用技术为决策装上“智能导航”
AI评审系统融合NLP、知识图谱与机器学习,破解传统评审效率低、标准不一难题。通过语义解析、智能推理与风险预判,构建标准化、可复用的智能评审流程,助力项目质量与效率双提升。(238字)
481 0
|
7月前
|
算法 搜索推荐 Java
贪心算法:部分背包问题深度解析
该Java代码基于贪心算法求解分数背包问题,通过按单位价值降序排序,优先装入高价值物品,并支持部分装入。核心包括冒泡排序优化、分阶段装入策略及精度控制,体现贪心选择性质,适用于可分割资源的最优化场景。
459 1
贪心算法:部分背包问题深度解析
|
机器学习/深度学习 编解码 人工智能
计算机视觉五大技术——深度学习在图像处理中的应用
深度学习利用多层神经网络实现人工智能,计算机视觉是其重要应用之一。图像分类通过卷积神经网络(CNN)判断图片类别,如“猫”或“狗”。目标检测不仅识别物体,还确定其位置,R-CNN系列模型逐步优化检测速度与精度。语义分割对图像每个像素分类,FCN开创像素级分类范式,DeepLab等进一步提升细节表现。实例分割结合目标检测与语义分割,Mask R-CNN实现精准实例区分。关键点检测用于人体姿态估计、人脸特征识别等,OpenPose和HRNet等技术推动该领域发展。这些方法在效率与准确性上不断进步,广泛应用于实际场景。
1429 64
计算机视觉五大技术——深度学习在图像处理中的应用
|
11月前
|
人工智能 IDE 定位技术
AI IDE正式上线!通义灵码开箱即用
作为AI原生的开发环境工具,通义灵码AI IDE深度适配了最新的千问3大模型,并全面集成通义灵码插件能力,具备编程智能体、行间建议预测、行间会话等功能。
1249 13
|
开发框架 Dart 前端开发
【Flutter前端技术开发专栏】Flutter与React Native的对比与选择
【4月更文挑战第30天】对比 Flutter(Dart,强类型,Google支持,快速热重载,高性能渲染)与 React Native(JavaScript,庞大生态,热重载,依赖原生渲染),文章讨论了开发语言、生态系统、性能、开发体验、学习曲线、社区支持及项目选择因素。两者各有优势,选择取决于项目需求、团队技能和长期维护考虑。参考文献包括官方文档和性能比较文章。
854 0
【Flutter前端技术开发专栏】Flutter与React Native的对比与选择

热门文章

最新文章

下一篇
开通oss服务