开发者社区> python人工智能命理> 正文

[雪峰磁针石博客]python计算机视觉深度学习2图像基础

简介: 构建自己的图像分类器之前需要了解图像是什么。 像素:图像的元素 像素是图像的基本元素。每个图像都由一组像素组成。没有比像素更细的粒度。 通常像素是光的“颜色”或“强度”。 下图的分辨率为1,000×750,这意味着它是1,000像素宽750像素高。
+关注继续查看

构建自己的图像分类器之前需要了解图像是什么。

像素:图像的元素

像素是图像的基本元素。每个图像都由一组像素组成。没有比像素更细的粒度。

通常像素是光的“颜色”或“强度”。

下图的分辨率为1,000×750,这意味着它是1,000像素宽750像素高。我们可以将图像概念化为(多维)矩阵。图片中总共有1,000×750 = 750,000像素。

image.png

大多数像素以两种方式表示:
1.灰度/单通道
2.颜色

在灰度图像中,每个像素是0到255之间的标量值,其中零对应为“黑色”,255为“白色”。
image.png

彩色像素通常在RGB颜色空间中表示(其他颜色空间通常要转成RGB)。

image.png

黑色:(0, 0, 0)
红色:(255, 0, 0)

RGB色彩空间的主要缺点包括:
•不使用“颜色选择器”工具时表示颜色不直观
•它不像人类看待颜色的方式。

image.png

image.png

图像坐标系统

OpenCV和scikit-image用多维NumPy数组表示RGB。

image.png

import cv2
image = cv2.imread("example.png")
print(image.shape)
cv2.imshow("Image", image)
cv2.waitKey(0)

执行结果:

$ python load_display.py
(248, 300, 3)

像素访问

(b, g, r) = image[20, 100] # accesses pixel at x=100, y=20
(b, g, r) = image[75, 25] # accesses pixel at x=25, y=75
(b, g, r) = image[90, 85] # accesses pixel at x=85, y=90

OpenCV的存储顺序:Blue, Green, Red

  • 技术支持qq群144081101 591302926 567351477 钉钉免费群:21745728

缩放

image.png

多数神经网络和卷积神经网络应用于图像任务分类要求固定大小的输入,意味着你通过的所有图像的尺寸必须相同。输入的宽度和高度图像尺寸的常见选择卷积神经网络包括32×32,64×64,224×224,227×227,256×256和299×299。

image.png

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
高性能计算技术也能助推大规模深度学习(百度实践)
本文描写了百度硅谷人工智能实验室在深度学习框架中引入HPC技术的实践,通过对OpenMPI里ring all-reduce算法进行改进,使语音识别训练模型的性能得到数十倍的提升,最后百度开源了其实现,希望更多的人受益。
3947 0
深度学习中正则化技术概述(附Python代码)
欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习、深度学习的知识! 磐石 介绍 数据科学研究者们最常遇见的问题之一就是怎样避免过拟合。
1832 0
基于深度学习的计算机视觉应用之目标检测
欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习、深度学习的知识! 目标检测作为图像处理和计算机视觉领域中的经典课题,在交通监控、图像检索、人机交互等方面有着广泛的应用。
1735 0
学习准备(下):计算机基础 | Python从入门到精通:入门篇之二
本章节继续讲授关于计算机基础的课程,包括进制、Python编辑器的安装以及编码方式等。
6378 0
ASP.NET MVC3 Razor视图引擎-“.NET技术”基础语法
  I:ASP.NET MVC3在Visual Studio 2010中的变化   在VS2010中新建一个MVC3项目可以看出与以往的MVC2发生了很明显的变化。   1.ASP.NET MVC3必要的运行环境为.NET 4.0 (想在3.5用MVC3,没门!)。
838 0
MySQL 基础---视图
视图: 本质上是一种虚拟表,其内容与真实表相似,包含一系列带有名称的列和行数据。 视图的特点如下: 视图的列可以来自不同的表,是表的抽象和在逻辑意义上建立的新关系。
768 0
+关注
python人工智能命理
提供书籍寻找服务,十元一本起,不成功不收费。 曾任职于腾讯、华为等公司,独立带队完成大型项目的全系统测试,担任过技术总监、测试经理以及测试专家职位。现任某主流公司自动化测试架构师。
170
文章
1
问答
文章排行榜
最热
最新
相关电子书
更多
JS零基础入门教程(上册)
立即下载
性能优化方法论
立即下载
手把手学习日志服务SLS,云启实验室实战指南
立即下载