15行Python代码 实现图像定位

简介: 15行Python代码 实现图像定位

阅读本文需要5.5分钟


本教程使用的环境:Windows 10    Python 3.6  

数据源:The Oxford-IIIT Pet Dataset


需要的第三方库:

    import tensorflow as tf
    import numpy as np
    import matplotlib.pyplot as plt
    %matplotlib inline
    from lxml import etree
    import glob
    from matplotlib.patches import Rectangle



    单张图片定位


    1 读取图片:(这里使用tensflow的方法读取)


    img = tf.io.read_file(r'\xxxxxxxx.jpg')

    2 解码图片:


    img = tf.image.decode_jpeg(img)

    3 显示下读取的图片


    plt.imshow(img)



    4 解析图片规格信息(这里是一个xml文件,我们使用爬虫将其图片信息爬取下来)

    文件格式如图:

      xml = open(r'xxxxxxx.xml').read()
      sel = etree.HTML(xml)
      width = int(sel.xpath('//size/width/text()')[0])
      height = int(sel.xpath('//size/height/text()')[0])
      xmin = int(sel.xpath('//bndbox/xmin/text()')[0])
      ymin = int(sel.xpath('//bndbox/ymin/text()')[0])
      xmax = int(sel.xpath('//bndbox/xmax/text()')[0])
      ymax = int(sel.xpath('//bndbox/ymax/text()')[0])

      5 定位

        plt.imshow(img)
        rec = Rectangle((xmin, ymin), (xmax-xmin), (ymax-ymin), fill=False, color='red')
        ax = plt.gca()
        ax.axes.add_patch(rec)

        输出:




        二 统一规划


        先给大家上一张图

        所有

        这是部分数据集图片,这里的图片大小不一,有的是长的有的是宽的。但是在创建data数据时,所有的图片数据应是统一的(也就是同长同高)所以我们得想个办法让其统一。

        由上面的案例我们知道头部的位置由 (xmin, ymin), (xmax-xmin), (ymax-ymin)所决定,所以我们可以通过“放缩”的思想来实现目标值


        1 统一图片大小(224,224):


        img = tf.image.resize(img, [224,224])
        img = img/255
        plt.imshow(img)



        2 确定相对于的目标值:


        xmin = (xmin/width)*224
        ymin = (ymin/height)*224
        xmax = (xmax/width)*224
        ymax = (ymax/height)*224

        3 定位:


        plt.imshow(img)
        rec = Rectangle((xmin, ymin), (xmax-xmin), (ymax-ymin), fill=False, color='red')
        ax = plt.gca()
        ax.axes.add_patch(rec)

        输出:


        这时就可以把所有数据集导入训练,建立管道,训练成模型。(建议使用GPU版本)

        若需要数据集,则在后台回复【数据集】即可获取

        相关文章
        |
        2天前
        |
        C++ 开发者 Python
        实现Python日志点击跳转到代码位置的方法
        本文介绍了如何在Python日志中实现点击跳转到代码位置的功能,以提升调试效率。通过结合`logging`模块的`findCaller()`方法记录代码位置信息,并使用支持点击跳转的日志查看工具(如VS Code、PyCharm),开发者可以从日志直接点击链接定位到出错代码,加快问题排查。
        12 2
        |
        2天前
        |
        算法 Java 编译器
        优化Python代码性能的实用技巧
        提高Python代码性能是每个开发者的关注焦点之一。本文将介绍一些实用的技巧和方法,帮助开发者优化他们的Python代码,提升程序的执行效率和性能。
        |
        1天前
        |
        Serverless Python
        Python----图像的手绘效果
        Python----图像的手绘效果
        7 1
        |
        2天前
        |
        Python
        Python代码扫描目录下的文件并获取路径
        【5月更文挑战第12天】Python代码扫描目录下的文件并获取路径
        17 1
        |
        2天前
        |
        数据处理 Python
        Python 代码中使用。
        Python 代码中使用。 z
        11 3
        |
        2天前
        |
        测试技术 Python
        解密Python中的装饰器:提升代码可读性与灵活性
        Python中的装饰器是一种强大的工具,能够在不改变原有函数结构的情况下,为函数添加额外功能。本文将深入探讨装饰器的原理及应用,介绍装饰器的基本语法和常见用法,并结合实例演示如何利用装饰器提升代码的可读性和灵活性,使代码更加简洁、模块化和易于维护。
        |
        2天前
        |
        测试技术 Python Windows
        【如何学习Python自动化测试】—— 多层窗口定位
        【如何学习Python自动化测试】—— 多层窗口定位
        8 1
        |
        2天前
        |
        监控 Python
        Python中的装饰器:提升代码灵活性和可维护性
        在Python编程中,装饰器是一种强大的工具,可以提高代码的灵活性和可维护性。本文将深入探讨装饰器的概念、用法和实际应用,帮助读者更好地理解并运用装饰器来优化自己的Python代码。
        |
        2天前
        |
        Python
        Python中的装饰器:提升代码可读性与复用性
        Python中的装饰器是一种强大的工具,能够提升代码的可读性和复用性。本文将深入探讨装饰器的原理、用法以及在实际项目中的应用,帮助读者更好地理解和利用这一特性,提升代码质量和开发效率。
        |
        2天前
        |
        监控 Python
        Python中的装饰器:提升代码可读性与可维护性
        Python中的装饰器是一种强大的工具,可以在不修改函数源代码的情况下,增加新的功能。本文将介绍装饰器的基本概念,以及如何使用装饰器来提升代码的可读性和可维护性。通过实例演示,读者将了解装饰器在各种场景下的灵活运用,从而更好地理解并应用于实际开发中。