备案控制台

开发者社区雷锋网文章正文

禅与奶罩识别艺术（上）

2017-08-02 1253

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

在昨天的卷积：如何成为一个很厉害的神经网络 - 知乎专栏中，热心网友提出了这样的问题：

禅与奶罩识别艺术（上）

该文在卷积神经网络的构成上讲解的比较直观，但是没有深入地探讨数学原理。本文将详细介绍卷积滤波器的具体机理，当然不要担心数学问题，只要能熟练掌握百以内加减法和九九乘法表就可以。

之前在微博上关于神经网络的探讨中，话题走向奇怪地走向了奶子（计划通り），并且王司图也做出了召唤柏木由纪的承诺，所以这次就以柏木由纪的照片为例，讲解图像处理的基本法。

禅与奶罩识别艺术（上）

01. 暗中观察

现在我们谈的“人工智能”都是弱人工智能，更确切地说，还是辅助计算工具。我们不能因为有了神经网络，就像卡兹一样停止思考。

所以不管借助神经网络解决任何问题，第一步也是最关键的一步，就是了解你的问题本身。反映在具体的应用上，就是要摸清业务背后的逻辑关系，而不是把数据往黑盒里一扔，开始准备炼丹。如果一遍摸不清，那就再摸一遍。

禅与奶罩识别艺术（上）

现在我们要做一个物体识别的程序，上图中可供识别的物体并不多，唯一凉鞋、一裤头、一奶罩而已，那就奶罩吧。作为一个入门程序，现在那么早就处理彩色图片，是不理智、不合适的。所以我们要进行一些简化，从皮相中剥离出骨相，把最核心的数学原理公然露出，放置Play。

经过“灰度->阈值”两步，彩图变成了黑白图。接下来我们要从计算机视觉的角度去司图，所以眼前的黑不是黑，你说的白也不是白，所见诸相非相，只是像素值，0 or 1。

禅与奶罩识别艺术（上）

02. 见微知著

暂时抛开图片背景，经过观察可知，要从人的身体上识别出奶罩和裤头，本质上是从白花花中寻找黑乎乎，其实就是从0中找到1。

那我们是不是需要整个奶罩呢？非也，只需要探测出奶罩的边缘就可以了，这就如同棋道，金角银边烂肚皮，只要围住了眼，就占住了气，从而控住了势。

卷积滤波器是一个比图片尺寸小的矩阵，这里设为3x3。我们把图片缩放至像素级（猜猜这是哪个部位），这里每一个小方格背后就是0或1了。卷积核在输入图像上来回滚动、摩擦，那么基本上会遇到三种区域（橙框）：

全白（肉体）
全黑（奶罩）
黑白（肉体和奶罩的边缘）

和下图的对应关系应该也很明显。

禅与奶罩识别艺术（上）

这时候，我们的卷积核就像情趣羽毛，扫遍每一个角落，撩拨你的动感地带。

禅与奶罩识别艺术（上）

03. 掐指一算

在上文的图表中，我们已经见识到了多种滤波器和对应的滤镜效果，比如边缘检测、锐化、均值模糊、高斯模糊。

禅与奶罩识别艺术（上）

来看第三种边缘检测卷积核，其矩阵为：

禅与奶罩识别艺术（上）

再取包含边缘的5x5区域，对应矩阵：

禅与奶罩识别艺术（上）

现在这个3x3矩阵（滤波器）要在5x5矩阵上摸一遍，当然摸不是为了爽，而是为计算一个值。计算方式如下图，黄色方格与红色数字即是卷积滤波器，而计算的方式就是重叠的对应元素相乘，再相加。（注意：这不是真正的「矩阵乘法」）

禅与奶罩识别艺术（上）

禅与奶罩识别艺术（上）

因为这里的image在竖直方向上是不变的，所以只需要让filter沿着最上端滑一圈就行了，总共有三次计算：

1.

禅与奶罩识别艺术（上）

2.

禅与奶罩识别艺术（上）

3.

禅与奶罩识别艺术（上）

最后生成的完整特征映射(Feature Map)将是：

禅与奶罩识别艺术（上）

特征映射的单元位置对应的是卷积核中心(8)的位置，特征映射的取值有三种：

-3：探测到奶罩边缘，且卷积核位于奶罩外侧
3：探测到奶罩边缘，且卷积核位于奶罩内侧
0: 没有探测到边缘特征

现在你应该已经明白了，为什么滤波器可以提取图片的特征。

====================================分割线================================

本文作者：AI研习社

本文转自雷锋网禁止二次转载，原文链接

文章标签：

人工智能

机器学习/深度学习

计算机视觉

玄学酱

目录

相关文章

楠竹11

|

3天前

|

人工智能机器人人机交互

哥大华人开发人脸机器人，照镜子自主模仿人类表情超逼真

【4月更文挑战第3天】哥伦比亚大学研究人员开发了一款名为Emo的机器人，能观察并模仿人类面部表情，实现更自然的人机交互。Emo配备26个面部执行器和高分辨率摄像头，通过“自我建模”学习模仿表情，并能预测人类表情变化。这一创新有望改善人机理解和响应情绪的能力，应用于教育、医疗等领域，但也引发了关于情感依赖和伦理问题的讨论。

楠竹11

34 4 6

哥大华人开发人脸机器人，照镜子自主模仿人类表情超逼真

钰11111

|

3天前

|

前端开发 JavaScript 搜索推荐

网页：技术与艺术的交汇点

网页：技术与艺术的交汇点

钰11111

8 1 1

-开发达人-

|

人工智能安全机器人

研究者意外发现DALL-E 2在用自创语言生成图像：全文黑话，人类都看不懂

研究者意外发现DALL-E 2在用自创语言生成图像：全文黑话，人类都看不懂

-开发达人-

101 0 0

1730617107579634

|

算法 JavaScript 前端开发

日拱算法：什么是“情感丰富的文字”？

本篇带来算法题：“情感丰富的文字”

1730617107579634

66 0 0

是乃德也是Ned

|

机器学习/深度学习存储人工智能

『程序员对联』抽取你的专属新春对联

新春这个文章说实话，经历了蛮多的，一开始其实我是想用`three.js`做个老虎的，但是呢，失败了。废了好几个小时才搞出来两个`虎爪`，害，都怪我`three.js`的能力连基本上手都算不上，没咋玩明白，下次一定给大家做点好康的~

是乃德也是Ned

192 0 0

一个处女座的程序猿

|

算法计算机视觉

CV：利用人工智能算法让古代皇帝画像以及古代四大美女画像动起来(模仿偶像胡歌剧中角色表情动作)

CV：利用人工智能算法让古代皇帝画像以及古代四大美女画像动起来(模仿偶像胡歌剧中角色表情动作)

一个处女座的程序猿

152 0 0

CV：利用人工智能算法让古代皇帝画像以及古代四大美女画像动起来(模仿偶像胡歌剧中角色表情动作)

-开发达人-

|

人工智能算法 vr&ar

「缸中之脑」成真？动态电极绕过眼睛直接刺激大脑，在盲人脑海画出字母

最新研究绕过眼睛，通过动态电极刺激大脑，直接让天生的盲人脑海中出现字母！「智子倒计时」、「缸中之脑」、「黑客帝国」，让人分不清虚拟还是现实的直接意识输入，或许真的离我们不远了。

-开发达人-

220 0 0

「缸中之脑」成真？动态电极绕过眼睛直接刺激大脑，在盲人脑海画出字母

-开发达人-

|

机器学习/深度学习人工智能自然语言处理

响铃：当AI翻译能识别“语境”，我们的“地球村”梦想就不远了

响铃：当AI翻译能识别“语境”，我们的“地球村”梦想就不远了

-开发达人-

184 0 0

响铃：当AI翻译能识别“语境”，我们的“地球村”梦想就不远了

杰克.陈

|

算法

图像滤镜艺术---最新美颜算法研究

原文:图像滤镜艺术---最新美颜算法研究本文所讲的美颜算法主要指磨皮+美白+肤色+清晰度；磨皮算法主要有两大类：①基于高反差保留的磨皮算法；②基于保边滤波器的磨皮算法；对于高反差保留磨皮算法，具体过程如：点击打开链...

杰克.陈

4136 0 1

行者武松

|

机器人 API

Joto的百变用途：能用笔作画的智能白板机器人

行者武松

1165 0 0

雷锋网

热门文章

最新文章

TCP三次握手与四次分手

袋鼠云数据中台专栏（五）：数栈，企业级一站式数据中台PaaS

利用Serverless Kubernetes和Kaniko快速自动化构建容器镜像

CentOS7(6.5)升级docker到较新版

如何判断自己IP是内网IP还是外网IP

模型社区实战训练营首开,开源让代码更有趣!

深入分析bgp选路规则(上)

2-Sat+输出可行解(个人模版)

一次ORA-00130: invalid listener address错误

PathFinding.js – 综合性的 JavaScript 路径查找库

AI大咖说-如何评价论文的创新性

实时计算 Flink版产品使用合集之在Flink Stream API中，可以在任务启动时初始化一些静态的参数并将其存储在内存中吗

实时计算 Flink版产品使用合集之支持在同步全量数据时使用checkpoint吗

51.从键盘上输入任意两个数和一个运算符（+、-、*、/），根据输入的运算符对两个数计算，并输出结果

50.编写程序，逆转字符串

49.输入一字符串，检查是否回文（回文是指正反序相同，如，LeveL）

48.输入任意正整数，编程判断该数是否为回文数(回文数是指从左到右读与从右到左读一样，如12321）

47.从键盘上输入一个3*3的矩阵，并求其主对角线元素的和

46.编写程序在屏幕上显示如下图形

45.将3×3二维数组转置，并输出

相关课程

更多

跨越N次元一键变身AI漫画人

人机对话技术浅析

声纹识别技术

【新人赛】工业蒸汽量预测建模算法代码开源分享合集

AI情绪鼓励师模型微调实操教学

相册服务中的故事生成算法介绍

相关电子书

更多

语义技术在儿童及其人上的突破

语义技术在儿童机器人上的突破

科学艺术交相辉映

相关实验场景

更多

函数计算部署AI艺术字应用，生成新春文字头像

使用PAI-DSW x EasyPhoto快速完成AIGC人物写真生成

基于阿里云DeepGPU实例，用AI画唯美国风少女

一键创建和部署高分电影推荐语音技能

下一篇

2024年阿里云免费云服务器及学生云服务器申请教程参考