鄙人水货刚接触LR,感觉似乎就是线性回归套个Sigmoid Function .
参数估计出来后,后面不知道怎么预测了 = =
参数有,变量没有,历史数据基本只判断出已买的东西……
求指导,感激不尽 T T
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
您好!听起来您正在学习逻辑回归(Logistic Regression, LR)模型,这是一个广泛应用于分类问题的统计方法。确实,逻辑回归在形式上与线性回归有相似之处,但它通过Sigmoid函数(或Logit函数)将连续的预测值映射到(0,1)区间内,从而得到概率预测,适用于二分类问题。
当您已经使用训练数据估计出逻辑回归模型的参数后,进行预测的步骤相对直接。即使您提到“历史数据基本只判断出已买的东西”,逻辑回归模型仍然可以基于这些特征来预测新样本的类别。下面是进行预测的基本步骤:
整理数据:首先确保您的新数据已经被正确预处理,这包括缺失值处理、编码(如果存在分类变量)、标准化/归一化等,这些步骤应该和训练数据时保持一致。
特征工程:根据模型训练时使用的特征,对新数据执行相同的特征工程操作。比如,如果训练时用到了某些变量的组合、哑变量编码等,预测时也要对新数据做同样的处理。
应用模型参数:有了处理好的新数据,接下来就是利用训练得到的模型参数(通常是权重向量和截距项)来进行预测。对于每个新样本,计算其特征与模型参数的点积,然后通过Sigmoid函数转换为概率值。
计算公式大致如下: [ P(Y=1|X) = \frac{1}{1 + e^{-(\beta_0 + \beta_1X_1 + \beta_2X_2 + ... + \beta_nX_n)}} ] 其中,(P(Y=1|X))是给定特征X下事件Y发生的概率,(\beta_0)是截距项,(\beta_1...\beta_n)是各特征对应的权重,(X_1...X_n)是新样本的特征值。
决策阈值:通常,我们会设定一个阈值(如0.5),如果计算出的概率大于这个阈值,则预测为正类(例如,购买),否则预测为负类(不购买)。当然,根据实际需求,这个阈值是可以调整的,以优化特定的业务指标(如精确度、召回率等)。
如果您使用的是阿里云的机器学习平台PAI(Platform of Artificial Intelligence),可以通过以下方式操作: - 在PAI Studio中,训练好逻辑回归模型后,可以直接使用该模型对新的数据集进行批预测或者实时预测。 - 对于批预测,上传预处理好的测试数据集,选择已训练的模型,提交预测任务即可获得预测结果。 - 对于实时预测,可以部署模型为在线服务,通过API调用来获取单个或少量样本的即时预测结果。
希望以上内容能帮助到您,如果有更具体的技术问题或需要进一步指导,请随时告知!