Py之pycocotools:pycocotools库的简介、安装、使用方法之详细攻略

简介: Py之pycocotools:pycocotools库的简介、安装、使用方法之详细攻略

pycocotools库的简介


      pycocotools是什么?即python api tools of COCO。COCO是一个大型的图像数据集,用于目标检测、分割、人的关键点检测、素材分割和标题生成。这个包提供了Matlab、Python和luaapi,这些api有助于在COCO中加载、解析和可视化注释。请访问http://cocodataset.org/,可以了解关于COCO的更多信息,包括数据、论文和教程。COCO网站上也描述了注释的确切格式。Matlab和PythonAPI是完整的,LuaAPI只提供基本功能。

      除了这个API,请下载COCO图片和注释,以便运行演示和使用API。两者都可以在项目网站上找到。


-请下载、解压缩并将图像放入:coco/images/

-请下载并将注释放在:coco/annotations中/

COCO API: http://cocodataset.org/




pycocotools库的安装


pip install pycocotools==2.0.0






pycocotools库的使用方法


1、from pycocotools.coco import COCO


__author__ = 'tylin'

__version__ = '2.0'

# Interface for accessing the Microsoft COCO dataset.

# Microsoft COCO is a large image dataset designed for object detection,

# segmentation, and caption generation. pycocotools is a Python API that

# assists in loading, parsing and visualizing the annotations in COCO.

# Please visit http://mscoco.org/ for more information on COCO, including

# for the data, paper, and tutorials. The exact format of the annotations

# is also described on the COCO website. For example usage of the pycocotools

# please see pycocotools_demo.ipynb. In addition to this API, please download both

# the COCO images and annotations in order to run the demo.

# An alternative to using the API is to load the annotations directly

# into Python dictionary

# Using the API provides additional utility functions. Note that this API

# supports both *instance* and *caption* annotations. In the case of

# captions not all functions are defined (e.g. categories are undefined).

# The following API functions are defined:

#  COCO       - COCO api class that loads COCO annotation file and prepare data structures.

#  decodeMask - Decode binary mask M encoded via run-length encoding.

#  encodeMask - Encode binary mask M using run-length encoding.

#  getAnnIds  - Get ann ids that satisfy given filter conditions.

#  getCatIds  - Get cat ids that satisfy given filter conditions.

#  getImgIds  - Get img ids that satisfy given filter conditions.

#  loadAnns   - Load anns with the specified ids.

#  loadCats   - Load cats with the specified ids.

#  loadImgs   - Load imgs with the specified ids.

#  annToMask  - Convert segmentation in an annotation to binary mask.

#  showAnns   - Display the specified annotations.

#  loadRes    - Load algorithm results and create API for accessing them.

#  download   - Download COCO images from mscoco.org server.

# Throughout the API "ann"=annotation, "cat"=category, and "img"=image.

# Help on each functions can be accessed by: "help COCO>function".

# See also COCO>decodeMask,

# COCO>encodeMask, COCO>getAnnIds, COCO>getCatIds,

# COCO>getImgIds, COCO>loadAnns, COCO>loadCats,

# COCO>loadImgs, COCO>annToMask, COCO>showAnns

# Microsoft COCO Toolbox.      version 2.0

# Data, paper, and tutorials available at:  http://mscoco.org/

# Code written by Piotr Dollar and Tsung-Yi Lin, 2014.

# Licensed under the Simplified BSD License [see bsd.txt]


2、输出COCO数据集信息并进行图片可视化


from pycocotools.coco import COCO

import matplotlib.pyplot as plt

import cv2

import os

import numpy as np

import random

#1、定义数据集路径

cocoRoot = "F:/File_Python/Resources/image/COCO"

dataType = "val2017"

annFile = os.path.join(cocoRoot, f'annotations/instances_{dataType}.json')

print(f'Annotation file: {annFile}')

#2、为实例注释初始化COCO的API

coco=COCO(annFile)

#3、采用不同函数获取对应数据或类别

ids = coco.getCatIds('person')[0]    #采用getCatIds函数获取"person"类别对应的ID

print(f'"person" 对应的序号: {ids}')

id = coco.getCatIds(['dog'])[0]      #获取某一类的所有图片,比如获取包含dog的所有图片

imgIds = coco.catToImgs[id]

print(f'包含dog的图片共有:{len(imgIds)}张, 分别是:',imgIds)

cats = coco.loadCats(1)               #采用loadCats函数获取序号对应的类别名称

print(f'"1" 对应的类别名称: {cats}')

imgIds = coco.getImgIds(catIds=[1])    #采用getImgIds函数获取满足特定条件的图片(交集),获取包含person的所有图片

print(f'包含person的图片共有:{len(imgIds)}张')

#4、将图片进行可视化

imgId = imgIds[10]

imgInfo = coco.loadImgs(imgId)[0]

print(f'图像{imgId}的信息如下:\n{imgInfo}')

imPath = os.path.join(cocoRoot, 'images', dataType, imgInfo['file_name'])                    

im = cv2.imread(imPath)

plt.axis('off')

plt.imshow(im)

plt.show()

plt.imshow(im); plt.axis('off')

annIds = coco.getAnnIds(imgIds=imgInfo['id'])      # 获取该图像对应的anns的Id

print(f'图像{imgInfo["id"]}包含{len(anns)}个ann对象,分别是:\n{annIds}')

anns = coco.loadAnns(annIds)

coco.showAnns(anns)

print(f'ann{annIds[3]}对应的mask如下:')

mask = coco.annToMask(anns[3])

plt.imshow(mask); plt.axis('off')



相关文章
|
机器学习/深度学习 数据采集 算法
大数据分析案例-基于随机森林模型对北京房价进行预测
大数据分析案例-基于随机森林模型对北京房价进行预测
1160 0
大数据分析案例-基于随机森林模型对北京房价进行预测
|
并行计算 PyTorch 测试技术
MMDetection系列 | 1. MMDetection安装流程与测试
MMDetection系列 | 1. MMDetection安装流程与测试
987 0
|
算法 数据库 计算机视觉
Dataset之COCO数据集:COCO数据集的简介、下载、使用方法之详细攻略
Dataset之COCO数据集:COCO数据集的简介、下载、使用方法之详细攻略
|
网络协议 编译器 Linux
【C语言】结构体内存对齐:热门面试话题
【C语言】结构体内存对齐:热门面试话题
419 0
|
9月前
|
Java 数据库连接 数据库
【潜意识Java】使用 Ruoyi 框架开发企业级应用,从零开始的实践指南和分析问题
本文介绍了基于Spring Boot的开源企业级框架Ruoyi,涵盖环境搭建、项目初始化及用户管理模块的创建。
871 4
|
12月前
|
机器学习/深度学习 人工智能 文字识别
ultralytics YOLO11 全新发布!(原理介绍+代码详见+结构框图)
本文详细介绍YOLO11,包括其全新特性、代码实现及结构框图,并提供如何使用NEU-DET数据集进行训练的指南。YOLO11在前代基础上引入了新功能和改进,如C3k2、C2PSA模块和更轻量级的分类检测头,显著提升了模型的性能和灵活性。文中还对比了YOLO11与YOLOv8的区别,并展示了训练过程和结果的可视化
18301 0
|
机器学习/深度学习 计算机视觉
TPAMI 2024:计算机视觉中基于图神经网络和图Transformers的方法和最新进展
【10月更文挑战第3天】近年来,图神经网络(GNNs)和图Transformers在计算机视觉领域取得显著进展,广泛应用于图像识别、目标检测和场景理解等任务。TPAMI 2024上的一篇综述文章全面回顾了它们在2D自然图像、视频、3D数据、视觉与语言结合及医学图像中的应用,并深入分析了其基本原理、优势与挑战。GNNs通过消息传递捕捉非欧式结构,图Transformers则结合Transformer模型提升表达能力。尽管存在图结构构建复杂和计算成本高等挑战,但这些技术仍展现出巨大潜力。论文详细内容见:https://arxiv.org/abs/2209.13232。
585 3
|
算法 计算机视觉
非极大值抑制详细原理(NMS含代码及详细注释)
非极大值抑制(Non-Maximum Suppression,NMS)详细原理(含代码及详细注释)
2329 1
非极大值抑制详细原理(NMS含代码及详细注释)
YOLOv8打印模型结构配置信息并查看网络模型详细参数:参数量、计算量(GFLOPS)
YOLOv8打印模型结构配置信息并查看网络模型详细参数:参数量、计算量(GFLOPS)
|
Windows Python
CCProxy代理服务器地址的设置步骤
CCProxy代理服务器地址的设置步骤
2761 10