浅述CV方向
一、浅述人工智能的一些术语
1. 人工智能初探
- 人工智能是通过机器来模拟人类认知能力的技术
- 人工智能最核心的能力就是根据给定的输入做出判断或预测
- 关键时间节点:1956年,达特茅斯会议,人工智能元年
1982年 提出机器学习
2006年 提出深度学习
*图灵测试(测试员分辨不出是机器还是真人)50年提出
2. 人工智能的三大要素
- 数据
- 算法
- 算力:CPU、GPU、FPGA(GPU造好了就不能改了,这种方式降低开发风险)、分布式
3. 人工智能关系圈
机器学习:一种实现人工智能的方法。
机器学习是计算机利用已有的数据(经验),得出了某种模型(规律),并利用此模型预测未来的一种方法。
深度学习:一种实现机器学习的技术。
深度学习是利用深度的神经网络,将模型处理的更为复杂,从而使模型对数据的理解更加深入,是机器学习中一种基于对数据的进行表征学习的方法。深度学习的实质是通过构建很多隐藏层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。
人工神经网络:一种机器学习的算法。
模拟人脑的思考过程,进行计算的模型,神经网络一般有输入层->隐藏层->输出层,一般来说隐藏层数量多于两层的神经网络就叫做深度神经网络,深度学习就是采用像深度神经网络这种深层架构的一种机器学习方法。
神经网络的逻辑架构
蓝色层为输入层,汇点出为输出层,中间称为隐藏层
4.深度学习
概念辨析:深度神经网络和深度学习
具有多个隐藏层的神经网络被称为深度神经网络,基于深度神经网络的机器学习研究称之为深度学习
二、CV方向
1. 定义
cv即计算机视觉
概括:就是计算机拥有人能所见、人能所识、人能所思的能力,就可以称为计算机拥有计算机视觉
典型基于深度学习的计算机视觉流程
2. cv关系圈
3.cv的五大应用
<1> 图像分类
主要工具:图像分类架构-卷积神经网络(CNN)、卷积、RELU 、POOL 等。
<2> 目标检测
主要工具:R-CNN
<3> 目标跟踪
<4> 语义分割(*)
主要工具:FCN
<5> 实例分割
主要工具:Mask-R-CNN (可以用于分析姿态)
4. cv方向的技能
基础技能
概率论与数理统计、线性代数、数学分析、深度学习、统计机器学习、凸优化、相机原理、3D计算机视觉、low-level视觉与图像处理、视觉神经科学
中间层技能
图像分类、图像分割、目标检测、目标跟踪、视频(序列图像)分析
应用层技能
OCR、图像检测、图像识别、视频内容理解(直播鉴黄、盗版检测等)、手势识别、人脸识别、图像/视频编辑和风格化、智能视频分析、图像与NLP结合、3D重建、工业视觉、无人驾驶、医疗影像诊断、神经网络芯片等