**使用Python实现逻辑回归的算法**-------文章中有源码

简介: **使用Python实现逻辑回归的算法**-------文章中有源码

实验目的

使用Python实现逻辑回归的算法

实验原理

(1)收集数据:采用任意方法收集数据。

(2)准备数据:由于需要进行距离计算,因此要求数据类型为数值型。另外,结构化数据格式则最佳。

(3)分析数据:采用任意方法对数据进行分析。

(4)训练算法:大部分时间将用于训练,训练的目的是为了找到最佳的分类回归系数。

(5)测试算法:一旦训练步骤完成,分类将会很快。

(6)使用算法:首先,我们需要输入一些数据,并将其转换成对应的结构化数值;接着,基于训练好的回归系数就可以对这些数值进行简单的回归计算,判定它们属于哪个类别;在这之后,我们就可以在输出的类别上做一些其他分析工作。


实验内容(表格区域可拉长)

(1)有如下数据集(2个特征,10个样本):logisticData.txt,试采用逻辑回归,计算各特征的权重和偏移。

(2)手写数字识别

压缩包中包含2个文件夹,分别名为trainingDigits(训练数据)和testDigits(测试数据),文件夹中存放如果txt文件,


代码:

import numpy as np
import os
def getData(path):
    data_x = []
    data_y = []
    for file in os.listdir(path): #遍历返回指定文件夹包含的文件或者文件夹名字列表
        #注意
        test = np.zeros(10, int)
        test[int(file[0])] = 1
        data_y.append(test)
        # temp=[1]
        # data_y.append(int(file[0]))
        with open(path + "/" + file) as lines:   #  读取所有文件
            temp = []
            for line in lines:  #  遍历
                x = line.strip()   #清洗数据
                for i in x:
                    temp.append(int(i))
            data_x.append(temp)
    return np.array(data_x), np.array(data_y)
def soft(z):
    h = []
    for i in z:
        i = i - np.max(i)
        one = []
        for j in i:
            one.append(np.exp(j) / np.sum(np.exp(i)))
        h.append(one)
    return np.array(h)
def logistic(x, y, a=0.0005, times=1000):
    m, n = x.shape   #  m=946  n=1024
    k,l=y.shape      #  l=10
    w = np.array(np.random.rand(n, l))
    #print(w)
    for i in range(times):
        z = np.dot(x, w)
        H = soft(z)
        gradient = np.dot(x.T, (H - y))
        w = w - a * gradient
    return w
def test_w(x, y, w):
    h = soft(np.dot(x, w))
    j=len(h)
    Q=len(y)
    sum = 0
    for i in range(j):
        index= np.argmax(h[i])   #返回最大元素索引
        h[i] = np.zeros(len(h[i]))  #自己创建指定大小的数组
        h[i][index] = 1
        if (h[i] == y[i]).all(): #判断参数是否都为true
            sum += 1
    return sum / Q
if __name__ == "__main__":
    x, y = getData("testDigits")
    print(y)
    x1, y1 = getData("trainingDigits")
    w = logistic(x, y)
    # print(w)
    print(test_w(x1, y1, w))

截图:

image.png

import numpy as np
def getData(path):
    data=[]
    with open(path) as lines: #读取所有文件
        for line in lines:   #遍历
            x=line.strip().split(" ")#清洗数据
            #列表,第一个元素为1
            temp=[1]
            for i in x:
                temp.append(int(i))
            data.append(temp)
    return data
def sigmoid(z):
    return 1/(1+np.exp(-z))
def logistic(x,y,a=0.01,times=20000):
    m,n=x.shape  #x.shape==shape[0]
    # print(m)  10
    # print(n)  3
    w=np.array(np.random.rand(n,1))
    for i in range(times):
        z=np.dot(x,w)
        H=sigmoid(z)
        gradient= np.dot(x.T,(H-y))
        w=w-a*gradient
    return w
if __name__=="__main__":
    data=getData("logisticData.txt")
    x=[]
    y=[]
    for i in data:
        x.append(i[:-1])
        y.append(i[-1])
    x=np.array(x)
    m=np.array(y).shape[0]  #读取一维的长度(shape(x,y),x行数,y列数)
    #print(m)
    y=np.array(y).reshape(m,1)  #转换成m行一列
    w=logistic(x,y)
    print(sigmoid(np.dot(x,w)))

image.png

目录
相关文章
|
1天前
|
算法 Serverless 数据处理
从集思录可转债数据探秘:Python与C++实现的移动平均算法应用
本文探讨了如何利用移动平均算法分析集思录提供的可转债数据,帮助投资者把握价格趋势。通过Python和C++两种编程语言实现简单移动平均(SMA),展示了数据处理的具体方法。Python代码借助`pandas`库轻松计算5日SMA,而C++代码则通过高效的数据处理展示了SMA的计算过程。集思录平台提供了详尽且及时的可转债数据,助力投资者结合算法与社区讨论,做出更明智的投资决策。掌握这些工具和技术,有助于在复杂多变的金融市场中挖掘更多价值。
22 12
|
7天前
|
监控 算法 安全
内网桌面监控软件深度解析:基于 Python 实现的 K-Means 算法研究
内网桌面监控软件通过实时监测员工操作,保障企业信息安全并提升效率。本文深入探讨K-Means聚类算法在该软件中的应用,解析其原理与实现。K-Means通过迭代更新簇中心,将数据划分为K个簇类,适用于行为分析、异常检测、资源优化及安全威胁识别等场景。文中提供了Python代码示例,展示如何实现K-Means算法,并模拟内网监控数据进行聚类分析。
28 10
|
11天前
|
机器学习/深度学习 存储 算法
解锁文件共享软件背后基于 Python 的二叉搜索树算法密码
文件共享软件在数字化时代扮演着连接全球用户、促进知识与数据交流的重要角色。二叉搜索树作为一种高效的数据结构,通过有序存储和快速检索文件,极大提升了文件共享平台的性能。它依据文件名或时间戳等关键属性排序,支持高效插入、删除和查找操作,显著优化用户体验。本文还展示了用Python实现的简单二叉搜索树代码,帮助理解其工作原理,并展望了该算法在分布式计算和机器学习领域的未来应用前景。
|
25天前
|
存储 算法 安全
控制局域网上网软件之 Python 字典树算法解析
控制局域网上网软件在现代网络管理中至关重要,用于控制设备的上网行为和访问权限。本文聚焦于字典树(Trie Tree)算法的应用,详细阐述其原理、优势及实现。通过字典树,软件能高效进行关键词匹配和过滤,提升系统性能。文中还提供了Python代码示例,展示了字典树在网址过滤和关键词屏蔽中的具体应用,为局域网的安全和管理提供有力支持。
50 17
|
27天前
|
监控 算法 安全
深度洞察内网监控电脑:基于Python的流量分析算法
在当今数字化环境中,内网监控电脑作为“守城卫士”,通过流量分析算法确保内网安全、稳定运行。基于Python的流量分析算法,利用`scapy`等工具捕获和解析数据包,提取关键信息,区分正常与异常流量。结合机器学习和可视化技术,进一步提升内网监控的精准性和效率,助力企业防范潜在威胁,保障业务顺畅。本文深入探讨了Python在内网监控中的应用,展示了其实战代码及未来发展方向。
|
28天前
|
存储 算法 安全
U 盘管控情境下 Python 二叉搜索树算法的深度剖析与探究
在信息技术高度发达的今天,数据安全至关重要。U盘作为常用的数据存储与传输工具,其管控尤为关键。本文探讨Python中的二叉搜索树算法在U盘管控中的应用,通过高效管理授权U盘信息,防止数据泄露,保障信息安全。二叉搜索树具有快速插入和查找的优势,适用于大量授权U盘的管理。尽管存在一些局限性,如树结构退化问题,但通过优化和改进,如采用自平衡树,可以有效提升U盘管控系统的性能和安全性。
26 3
|
29天前
|
存储 人工智能 算法
深度解密:员工飞单需要什么证据之Python算法洞察
员工飞单是企业运营中的隐性风险,严重侵蚀公司利润。为应对这一问题,精准搜集证据至关重要。本文探讨如何利用Python编程语言及其数据结构和算法,高效取证。通过创建Transaction类存储交易数据,使用列表管理订单信息,结合排序算法和正则表达式分析交易时间和聊天记录,帮助企业识别潜在的飞单行为。Python的强大功能使得从交易流水和沟通记录中提取关键证据变得更加系统化和高效,为企业维权提供有力支持。
|
Linux C语言 开发者
源码安装Python学会有用还能装逼 | 解决各种坑
相信朋友们都看过这个零基础学习Python的开篇了
475 0
源码安装Python学会有用还能装逼 | 解决各种坑

推荐镜像

更多