逻辑回归虽然被称为回归,但一般被用来处理分类问题,它可将样本的特征和样本发生的概率联系起来,是一种监督学习的方法。
什么是逻辑回归
在线性回归中,输入和输出呈一定的关系且输出为连续的,即。如果输出的y不表示为一个值,而是一个概率p,则公式更改为,从线性回归输出一个具体的值到输出概率的过程需要一个中间公式,这个中间公式为。当没有中间公式的转换时,就是一个回归问题;加了中间公式之后,就是一个分类问题。加入这个公式后,对于连续的输入,输出是不连续的,即每一个输入都会被分到某一类输出中,这个中间公式可以解决二分类问题,如果想解决多分类问题,可以使用其他中间公式。
线性回归中有公式,在逻辑回归中,x可以为任意数(或多维数组),但是输出的概率值域为[0,1]。将线性回归的公式更改为,将作为新的特征可得到概率,往往使用sigmoid()函数,称为激活函数。