机器学习-逻辑回归-分类

简介: 1. 逻辑回归监督学习中另一个问题为分类问题,常见的分类问题例子有邮件是否是垃圾邮件,0表示垃圾邮件,1表示正常邮件在线交易是否会欺骗用户,0表示会欺骗,1表示不会患肿瘤患者是良性还是恶性,0表示恶性,1表示良性这些问题,可以归之于二...

1. 逻辑回归

监督学习中另一个问题为分类问题,常见的分类问题例子有

  1. 邮件是否是垃圾邮件,0表示垃圾邮件,1表示正常邮件
  2. 在线交易是否会欺骗用户,0表示会欺骗,1表示不会
  3. 患肿瘤患者是良性还是恶性,0表示恶性,1表示良性

这些问题,可以归之于二分类问题,y表示因变量,取值0和1,可以定义如下

其中0表示负例,1表示正例 同理,对于多分类问题来说,因变量y的值可以取{0,1,2,3 ... n}

我们先从二分类问题入手,理解什么是逻辑回归模型

逻辑回归(Logistic Regression)是一种用于解决二分类问题(0 or 1)的机器学习模型 逻辑回归(Logistic Regression)与线性回归(Linear Regression)都是一种广义线性模型(generalized linear model)逻辑回归假设因变量y 服从伯努利分布,而线性回归假设因变量y服从高斯分布

逻辑回归虽然带有"回归"2个,但是却是一个实实在在的分类算法

2. 逻辑回归模型

线性回归模型中,假设函数h(x)预测的值是连续的,预测值在[负无穷, 正无穷]

对于二分类问题来说最终的预测值是{0,1}离散集合,我们需要找出一个预测函数模型,使其值的输出在 [0, 1] 之间。然后我们选择一个阀值d,比如 0.5 ,如果预测值算出来大于 0.5 就认为分类结果为1,反之则认为分类结果为0.

因此我们引入了函数g, 同时假设逻辑回归模型的假设函数h(x)如下

这个函数称为Sigmoid函数,也称为逻辑函数(Logistic function) 函数曲线如下

线性回归模型假设函数h(x) = (theta^T * x), (theta^T * x)值域在[负无穷, 正无穷],函数h(x) = g(theta^T * x)预测值在[0, 1]之间

我们可以设置一个阈值d,当h(x) < d的时候预测分类结果为0,当h(x) >= d的时候预测分类结果为1

假设阀值d = 0.5

  1. 当h(x) >= 0.5的时候,则预测分类结果为1
  2. 当h(x) < 0.5的时候,则预测分类结果为0

因此函数h(x)的输出可以解释为分类结果为1时的概率

3. 决策边界

假设阀值d=0.5, 当h(x) >= 0.5的时候,预测分类结果为1

从逻辑函数的曲线图可知,对于函数h(x) = g(theta^T * x) >= 0.5 等价于theta^T * x >= 0

我们称 theta^T * x = 0 是模型的决策边界,大于0的时候预测分类结果为1,小于0的时候预测分类结果为0.

举个例子 假设h(x) = g(theta0 + theta1x1 + theta2x2),theta0, theta1, theta2 分别取-3, 1, 1 由上可知,决策边界 -3 + x1 + x2 = 0 是一个线性的方程,如下图所示

当h(x)更加复杂的时候,决策边界可能是一个非线性的方程

目录
相关文章
|
1月前
|
机器学习/深度学习
如何用贝叶斯方法来解决机器学习中的分类问题?
【10月更文挑战第5天】如何用贝叶斯方法来解决机器学习中的分类问题?
|
1月前
|
机器学习/深度学习 算法 知识图谱
【机器学习】逻辑回归原理(极大似然估计,逻辑函数Sigmod函数模型详解!!!)
【机器学习】逻辑回归原理(极大似然估计,逻辑函数Sigmod函数模型详解!!!)
|
1月前
|
机器学习/深度学习 存储 自然语言处理
【机器学习】基于逻辑回归的分类预测
【机器学习】基于逻辑回归的分类预测
|
1月前
|
机器学习/深度学习 算法 数据可视化
机器学习的核心功能:分类、回归、聚类与降维
机器学习领域的基本功能类型通常按照学习模式、预测目标和算法适用性来分类。这些类型包括监督学习、无监督学习、半监督学习和强化学习。
42 0
|
1月前
|
机器学习/深度学习 算法
【机器学习】逻辑回归介绍(逻辑回归应用场景,原理,损失及优化详解!!!)
【机器学习】逻辑回归介绍(逻辑回归应用场景,原理,损失及优化详解!!!)
|
1月前
|
机器学习/深度学习 传感器 算法
机器学习入门(一):机器学习分类 | 监督学习 强化学习概念
机器学习入门(一):机器学习分类 | 监督学习 强化学习概念
|
3月前
|
机器学习/深度学习 人工智能 算法
【人工智能】机器学习、分类问题和逻辑回归的基本概念、步骤、特点以及多分类问题的处理方法
机器学习是人工智能的一个核心分支,它专注于开发算法,使计算机系统能够自动地从数据中学习并改进其性能,而无需进行明确的编程。这些算法能够识别数据中的模式,并利用这些模式来做出预测或决策。机器学习的主要应用领域包括自然语言处理、计算机视觉、推荐系统、金融预测、医疗诊断等。
68 1
|
3月前
|
机器学习/深度学习 算法
【机器学习】SVM面试题:简单介绍一下SVM?支持向量机SVM、逻辑回归LR、决策树DT的直观对比和理论对比,该如何选择?SVM为什么采用间隔最大化?为什么要将求解SVM的原始问题转换为其对偶问题?
支持向量机(SVM)的介绍,包括其基本概念、与逻辑回归(LR)和决策树(DT)的直观和理论对比,如何选择这些算法,SVM为何采用间隔最大化,求解SVM时为何转换为对偶问题,核函数的引入原因,以及SVM对缺失数据的敏感性。
75 3
|
3月前
|
机器学习/深度学习 算法
【机器学习】简单解释贝叶斯公式和朴素贝叶斯分类?(面试回答)
简要解释了贝叶斯公式及其在朴素贝叶斯分类算法中的应用,包括算法的基本原理和步骤。
78 1
|
3月前
|
机器学习/深度学习 算法
【机器学习】支持向量机SVM、逻辑回归LR、决策树DT的直观对比和理论对比,该如何选择(面试回答)?
文章对支持向量机(SVM)、逻辑回归(LR)和决策树(DT)进行了直观和理论上的对比,并提供了在选择这些算法时的考虑因素,包括模型复杂度、损失函数、数据量需求、对缺失值的敏感度等。
63 1

热门文章

最新文章

下一篇
无影云桌面