**使用Python实现逻辑回归的算法**-------文章中有源码

简介: **使用Python实现逻辑回归的算法**-------文章中有源码

实验目的

使用Python实现逻辑回归的算法

实验原理

(1)收集数据:采用任意方法收集数据。

(2)准备数据:由于需要进行距离计算,因此要求数据类型为数值型。另外,结构化数据格式则最佳。

(3)分析数据:采用任意方法对数据进行分析。

(4)训练算法:大部分时间将用于训练,训练的目的是为了找到最佳的分类回归系数。

(5)测试算法:一旦训练步骤完成,分类将会很快。

(6)使用算法:首先,我们需要输入一些数据,并将其转换成对应的结构化数值;接着,基于训练好的回归系数就可以对这些数值进行简单的回归计算,判定它们属于哪个类别;在这之后,我们就可以在输出的类别上做一些其他分析工作。


实验内容(表格区域可拉长)

(1)有如下数据集(2个特征,10个样本):logisticData.txt,试采用逻辑回归,计算各特征的权重和偏移。

(2)手写数字识别

压缩包中包含2个文件夹,分别名为trainingDigits(训练数据)和testDigits(测试数据),文件夹中存放如果txt文件,


代码:

import numpy as np
import os
def getData(path):
    data_x = []
    data_y = []
    for file in os.listdir(path): #遍历返回指定文件夹包含的文件或者文件夹名字列表
        #注意
        test = np.zeros(10, int)
        test[int(file[0])] = 1
        data_y.append(test)
        # temp=[1]
        # data_y.append(int(file[0]))
        with open(path + "/" + file) as lines:   #  读取所有文件
            temp = []
            for line in lines:  #  遍历
                x = line.strip()   #清洗数据
                for i in x:
                    temp.append(int(i))
            data_x.append(temp)
    return np.array(data_x), np.array(data_y)
def soft(z):
    h = []
    for i in z:
        i = i - np.max(i)
        one = []
        for j in i:
            one.append(np.exp(j) / np.sum(np.exp(i)))
        h.append(one)
    return np.array(h)
def logistic(x, y, a=0.0005, times=1000):
    m, n = x.shape   #  m=946  n=1024
    k,l=y.shape      #  l=10
    w = np.array(np.random.rand(n, l))
    #print(w)
    for i in range(times):
        z = np.dot(x, w)
        H = soft(z)
        gradient = np.dot(x.T, (H - y))
        w = w - a * gradient
    return w
def test_w(x, y, w):
    h = soft(np.dot(x, w))
    j=len(h)
    Q=len(y)
    sum = 0
    for i in range(j):
        index= np.argmax(h[i])   #返回最大元素索引
        h[i] = np.zeros(len(h[i]))  #自己创建指定大小的数组
        h[i][index] = 1
        if (h[i] == y[i]).all(): #判断参数是否都为true
            sum += 1
    return sum / Q
if __name__ == "__main__":
    x, y = getData("testDigits")
    print(y)
    x1, y1 = getData("trainingDigits")
    w = logistic(x, y)
    # print(w)
    print(test_w(x1, y1, w))

截图:

image.png

import numpy as np
def getData(path):
    data=[]
    with open(path) as lines: #读取所有文件
        for line in lines:   #遍历
            x=line.strip().split(" ")#清洗数据
            #列表,第一个元素为1
            temp=[1]
            for i in x:
                temp.append(int(i))
            data.append(temp)
    return data
def sigmoid(z):
    return 1/(1+np.exp(-z))
def logistic(x,y,a=0.01,times=20000):
    m,n=x.shape  #x.shape==shape[0]
    # print(m)  10
    # print(n)  3
    w=np.array(np.random.rand(n,1))
    for i in range(times):
        z=np.dot(x,w)
        H=sigmoid(z)
        gradient= np.dot(x.T,(H-y))
        w=w-a*gradient
    return w
if __name__=="__main__":
    data=getData("logisticData.txt")
    x=[]
    y=[]
    for i in data:
        x.append(i[:-1])
        y.append(i[-1])
    x=np.array(x)
    m=np.array(y).shape[0]  #读取一维的长度(shape(x,y),x行数,y列数)
    #print(m)
    y=np.array(y).reshape(m,1)  #转换成m行一列
    w=logistic(x,y)
    print(sigmoid(np.dot(x,w)))

image.png

目录
相关文章
|
27天前
|
算法 前端开发 数据处理
小白学python-深入解析一位字符判定算法
小白学python-深入解析一位字符判定算法
45 0
|
1月前
|
机器学习/深度学习 算法 搜索推荐
从理论到实践,Python算法复杂度分析一站式教程,助你轻松驾驭大数据挑战!
【10月更文挑战第4天】在大数据时代,算法效率至关重要。本文从理论入手,介绍时间复杂度和空间复杂度两个核心概念,并通过冒泡排序和快速排序的Python实现详细分析其复杂度。冒泡排序的时间复杂度为O(n^2),空间复杂度为O(1);快速排序平均时间复杂度为O(n log n),空间复杂度为O(log n)。文章还介绍了算法选择、分而治之及空间换时间等优化策略,帮助你在大数据挑战中游刃有余。
54 4
|
1月前
|
机器学习/深度学习 缓存 算法
Python算法设计中的时间复杂度与空间复杂度,你真的理解对了吗?
【10月更文挑战第4天】在Python编程中,算法的设计与优化至关重要,尤其在数据处理、科学计算及机器学习领域。本文探讨了评估算法性能的核心指标——时间复杂度和空间复杂度。通过详细解释两者的概念,并提供快速排序和字符串反转的示例代码,帮助读者深入理解这些概念。同时,文章还讨论了如何在实际应用中平衡时间和空间复杂度,以实现最优性能。
57 6
|
28天前
|
存储 机器学习/深度学习 算法
蓝桥杯练习题(三):Python组之算法训练提高综合五十题
蓝桥杯Python编程练习题的集合,涵盖了从基础到提高的多个算法题目及其解答。
50 3
蓝桥杯练习题(三):Python组之算法训练提高综合五十题
|
10天前
|
算法 测试技术 开发者
在Python开发中,性能优化和代码审查至关重要。性能优化通过改进代码结构和算法提高程序运行速度,减少资源消耗
在Python开发中,性能优化和代码审查至关重要。性能优化通过改进代码结构和算法提高程序运行速度,减少资源消耗;代码审查通过检查源代码发现潜在问题,提高代码质量和团队协作效率。本文介绍了一些实用的技巧和工具,帮助开发者提升开发效率。
14 3
|
12天前
|
机器学习/深度学习 人工智能 算法
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
49 0
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
|
17天前
|
机器学习/深度学习 算法 Java
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
|
25天前
|
机器学习/深度学习 人工智能 算法
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
玉米病害识别系统,本系统使用Python作为主要开发语言,通过收集了8种常见的玉米叶部病害图片数据集('矮花叶病', '健康', '灰斑病一般', '灰斑病严重', '锈病一般', '锈病严重', '叶斑病一般', '叶斑病严重'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。再使用Django搭建Web网页操作平台,实现用户上传一张玉米病害图片识别其名称。
50 0
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
|
10天前
|
设计模式 开发者 Python
Python编程中的设计模式:工厂方法模式###
本文深入浅出地探讨了Python编程中的一种重要设计模式——工厂方法模式。通过具体案例和代码示例,我们将了解工厂方法模式的定义、应用场景、实现步骤以及其优势与潜在缺点。无论你是Python新手还是有经验的开发者,都能从本文中获得关于如何在实际项目中有效应用工厂方法模式的启发。 ###
|
3天前
|
存储 人工智能 数据挖掘
从零起步,揭秘Python编程如何带你从新手村迈向高手殿堂
【10月更文挑战第32天】Python,诞生于1991年的高级编程语言,以其简洁明了的语法成为众多程序员的入门首选。从基础的变量类型、控制流到列表、字典等数据结构,再到函数定义与调用及面向对象编程,Python提供了丰富的功能和强大的库支持,适用于Web开发、数据分析、人工智能等多个领域。学习Python不仅是掌握一门语言,更是加入一个充满活力的技术社区,开启探索未知世界的旅程。
12 5

热门文章

最新文章