人工智能、机器学习、深度学习的关系
网络异常,图片无法展示
|
- 人工智能:是研究、开发用于模拟、延伸和扩展人的智能的理论、方法及应用系统的一门新的技术科学。
- 机器学习:专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。是人工智能的核心研究领域之一。
- 深度学习:源于人工神经网络的研究,多层感知器就是一种深度学习结构。深度学习是机器学习研究中的一个新的领域,它模仿人脑的机制来解释数据,例如图像,声音和文本。
为什么人工智能、深度学习最近十年才取得成功
最近十年才取得成功主要是由于高效的编程语言、算法优化、计算机体系结构改进、并行计算以及分布式系统的发展。
海量的(标识)数据
互联网服务和大数据平台给深度学习带来了大量的数据集。
数据来源:
- 搜索引擎:对于图像搜索: 如ImageNet,Coco等;对于文本搜索: 维基百科(自然语言数据集)
- 商业网站:如亚马逊,淘宝(推荐系统数据集, 广告数据集)
- 其他互联网服务:如siri,cortana
对于图像分类问题来说,从最初的MNIST数据集到ImageNet,再到网站图像,数据规模越来越大。
网络异常,图片无法展示
|
深度学习算法的进步
采用MNIST数据集,进行手写数字体识别来说:
- 一个简单的卷积神经网络方法可以等同于最好的 SVM 方法 (1998 年)
- 深度卷积神经网络方法可以将错误率降低至 0.23%(2012 年),而人类为 0.2%
网络异常,图片无法展示
|
编程语言及计算框架的发展
从硬件层面来看,从早起的线性代数库(CPU/GPU),到之后的密集矩阵引擎(GPU),再到后来专门的AI加速器(TPU),处理能力得到了很大的提升。
同时,从早期计算框架需要自定义想要的机器学习算法(Theano/DisBelif/Caffe),到后面的深度学习框架(MxNet/TensorFlow/CNTK/Pytorch)提供更简单的方法来利用各种库,计算框架也得到了十足的进步。
网络异常,图片无法展示
|
计算能力的提升
从第一台通用计算机的诞生(eniac),到英特尔 Xeon(至强) X5,再到后面的GPU/TPU,计算能力不断攀升。
网络异常,图片无法展示
|
人工智能的面临的问题
- 隐私问题:现有的人工智能算法都是数据驱动,我们需要大量的数据来训练模型。我们每天在享受人工智能带来的便捷的同时,例如Facebook,谷歌,亚马逊,阿里巴巴等科技公司在获取大量的用户数据。
- 安全问题:例如,黑客利用人工智能技术、非法窃取私人信息或者模拟用户的行为并试图改变方法。
- 可信度问题:随着计算机视觉的发展,图像及视频的可信度也越来越低。现在我们可以通过PS,GAN(生成对抗网络)等技术制作假图像,让人难分真伪。
人工智能未来展望
- 框架:更易用的开发框架。
- 算法:性能更优,体积更小的算法模型
- 算力:端-边-云全面发展的算力。
- 数据:更完善的基础数据服务产业,更安全的数据共享。
- 场景:不断突破的行业应用。
总结
总之,人工智能、深度学习近年来的十足进步来源于算法、数据、系统等多方面的突破。与此同时,系统面临得新问题也与新的应用问题和挑战相伴而生。