机器学习之——初识神经网络

简介: 在讨论神经网络之前,我们先回顾一下之前的一系列讨论。 之前我们已经讨论过,非线性假设(Non-Linear Hypothesis),使用非线性的多项式能够帮助我们建立更好的分类模型(Classification)。假设我们有非常多的特征,例如大于10000个变量,我们希望用这10000个特征来构建一个非线性的多项式模型,那么结果将是数量非常惊人的特征组合,即便我们只采用两两特征的组合(x

在讨论神经网络之前,我们先回顾一下之前的一系列讨论。

之前我们已经讨论过,非线性假设(Non-Linear Hypothesis),使用非线性的多项式能够帮助我们建立更好的分类模型(Classification)。假设我们有非常多的特征,例如大于10000个变量,我们希望用这10000个特征来构建一个非线性的多项式模型,那么结果将是数量非常惊人的特征组合,即便我们只采用两两特征的组合(x1x2+x1x3+x1x4+...+x9999x10000),我们也会有接近500000哥组合而成的特征。这对于一般的逻辑回归(Logistic Regression)来说,需要计算的特征太多了。

我们举一个假设:

假设我们希望训练一个模型来识别视觉图像(例如识别一张图片上是否是一辆汽车,Google之前做过一个根据YouTube的视频来准确的识别出一只猫),我们怎么样才能这样做呢?一种方法是,我们利用很多汽车的图片和很多非汽车的图片,然后利用这些图片上一个个像素的值来作为特征。

假如我们只选用灰度图片,每个像素只有一个值(非RGB值),我们可以选取图片上的两个不同位置的两个像素,然后训练一个逻辑回归模型来利用这两个像素的值来判断图片上是否是一辆汽车:


假如我们采用的都是50x50像素的小图片,并且我们将所有的像素视为特征,则会有2500个特征,如果我们要进一步将两两特征组合构成一个多项式模型,则会有2500x2500/2(接近300万)个特征。普通的逻辑回归模型,不能有效的处理这么多的特征,这时候,我们就可以使用神经网络。

那么神经网络是从何而来的呢?

神经网络算法(Neural Network)源自于人类对大脑的模仿。在20世纪80到90年代被广泛的使用过,之后的应用逐渐减少,直到最近几年又变得开始流行起来。原因是,神经网络是非常依赖计算能力的算法,在较早之前的应用时,由于计算机的计算能力瓶颈,导致一度消退,随着计算机性能的不断提高,神经网络算法又成为了很有效的一门技术。

神经网络算法的目的是发现一个能够模仿人类大脑学习能力的算法。有一个实验,如果我们将视觉信号传递给大脑中负责其他感觉——如触觉——的大脑皮层区,我们发现负责处理触觉的大脑组织将能够很快地学会如何处理视觉信号。我们就推断,在大脑的不同组织不同神经之间,使用着一套学习算法,使得将外界的刺激作为输入,能够对输入进行相同的处理。


有另外一个案例,让舌头学会如何去“看”东西。再一个盲人的头顶配置了一台低像素的照相机,然后将照相机拍摄的照片的像素转换为不同的电极,每个像素都按照亮度被赋予一个不同的电压值。结果随着实验的进行,这个盲人开始能够利用舌头看到眼前的东西。目前这一项技术正在逐渐的应用到帮助盲人恢复视觉上,例如Google、微软。(希望我们中国也很快能够有这样一家造福社会的公司!)


为了构建神经网络模型,我们首先要思考:大脑中的神经网络是什么结构?

每一个神经元都可以被认为是一个处理单元/神经核(Processing Unit/Nucleus),它含有许多输入/树突(Input/Dendrite),并且有一个输出/轴突(Output/Axon)。神经网络是由大量的神经元相互链接并通过电脉冲来交流的一个网络结构。


神经网络模型建立在需要的神经元智商,每一个神经元又是一个个学习模型。这些神经元,也叫激活单元(Activation Unit)采纳一些特征作为输入,并且根据本身的模型提供一个输出。下面是一个以逻辑回归模型作为自身学习模型的神经元的示例,在神经网络中,参数也可以被称之为权重(Weight)


这一次我们先讨论到这里。下一次我们将讨论,神经网络模型的具体表达。


相关文章
|
7天前
|
机器学习/深度学习 算法 TensorFlow
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
交通标志识别系统。本系统使用Python作为主要编程语言,在交通标志图像识别功能实现中,基于TensorFlow搭建卷积神经网络算法模型,通过对收集到的58种常见的交通标志图像作为数据集,进行迭代训练最后得到一个识别精度较高的模型文件,然后保存为本地的h5格式文件。再使用Django开发Web网页端操作界面,实现用户上传一张交通标志图片,识别其名称。
37 6
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
|
7天前
|
机器学习/深度学习 安全 网络安全
利用机器学习优化网络安全威胁检测
【9月更文挑战第20天】在数字时代,网络安全成为企业和个人面临的重大挑战。传统的安全措施往往无法有效应对日益复杂的网络攻击手段。本文将探讨如何通过机器学习技术来提升威胁检测的效率和准确性,旨在为读者提供一种创新的视角,以理解和实施机器学习在网络安全中的应用,从而更好地保护数据和系统免受侵害。
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
机器学习模型之深度神经网络的特点
深度神经网络(Deep Neural Networks, DNNs)是一类机器学习模型,通过多个层级(层)的神经元来模拟人脑的工作方式,从而实现复杂的数据处理和模式识别任务。
25 1
|
18天前
|
机器学习/深度学习 人工智能 TensorFlow
神经网络入门到精通:Python带你搭建AI思维,解锁机器学习的无限可能
【9月更文挑战第10天】神经网络是开启人工智能大门的钥匙,不仅是一种技术,更是模仿人脑思考的奇迹。本文从基础概念入手,通过Python和TensorFlow搭建手写数字识别的神经网络,逐步解析数据加载、模型定义、训练及评估的全过程。随着学习深入,我们将探索深度神经网络、卷积神经网络等高级话题,并掌握优化模型性能的方法。通过不断实践,你将能构建自己的AI系统,解锁机器学习的无限潜能。
14 0
|
27天前
|
Java 前端开发 Apache
Apache Wicket与Spring MVC等Java Web框架大PK,究竟谁才是你的最佳拍档?点击揭秘!
【8月更文挑战第31天】在Java Web开发领域,众多框架各具特色。Apache Wicket以组件化开发和易用性脱颖而出,提高了代码的可维护性和可读性。相比之下,Spring MVC拥有强大的生态系统,但学习曲线较陡;JSF与Java EE紧密集成,但在性能和灵活性上略逊一筹;Struts2虽成熟,但在RESTful API支持上不足。选择框架时还需考虑社区支持和文档完善程度。希望本文能帮助开发者找到最适合自己的框架。
30 0
|
27天前
|
机器学习/深度学习 自然语言处理 TensorFlow
TensorFlow 入门超简单!从零开始构建你的第一个神经网络,开启机器学习精彩之旅!
【8月更文挑战第31天】本文介绍了流行开源机器学习框架 TensorFlow,涵盖其安装与首个神经网络构建步骤。TensorFlow 由 Google 开发,适用于计算机视觉及自然语言处理等领域。掌握它不仅提升就业机会,还加深对机器学习的理解。通过安装 Python 并使用 pip 命令安装 TensorFlow,即可按照示例构建、训练并评估简单的线性回归模型,快速开启机器学习之旅。
22 0
|
3天前
|
存储 安全 算法
网络安全与信息安全:守护数字世界的坚盾
在这个数字时代,网络安全已成为我们不可忽视的重要议题。本文将深入探讨网络安全漏洞的成因及影响、加密技术的工作原理与应用、以及安全意识的培养和重要性。通过这些内容的学习,读者将能够更好地理解如何保护自己的信息安全,预防潜在的网络威胁。
|
1天前
|
机器学习/深度学习 安全 网络安全
云计算时代的守护者:网络安全与信息安全的融合
在云计算的大潮中,网络安全与信息安全成为了支撑技术发展的两大支柱。本文将探讨云服务、网络安全和信息安全的相互关系,以及如何在这个互联网快速发展的时代,保护我们的数字资产。
|
1天前
|
存储 监控 安全
网络安全与信息安全:守护数字世界的钥匙
本文深入探讨了网络安全与信息安全的重要性,详细解析了网络漏洞、加密技术以及安全意识等关键领域。通过对实际案例的分析,揭示了网络安全漏洞的严重性和普遍性,强调了加密技术在保护数据安全中的核心作用,同时呼吁提升公众的安全意识,共同构建安全可靠的网络环境。
|
1天前
|
存储 安全 算法
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
本文深入探讨了网络安全和信息安全领域的关键要素,包括网络安全漏洞、加密技术和安全意识。首先,文章介绍了网络安全漏洞的定义、类型以及发现和修复过程。接着,详细阐述了加密技术的原理、应用及其在保护数据安全中的重要性。最后,强调了提高安全意识的必要性,并提供了实用的安全建议。通过综合分析这些方面,本文旨在为读者提供全面的网络安全和信息安全知识,帮助他们更好地保护自己的在线安全。

热门文章

最新文章