介绍
分割是计算机视觉中的一个关键任务,在医学成像、机器人技术和自动驾驶汽车等领域具有广泛的应用。YOLO(You Only Look Once)是一组以其速度和精度而著名的目标检测模型。要使用YOLO进行分割,可以扩展YOLO目标检测模型,以预测图像中每个找到的对象的像素级掩码。
在这篇博客文章中,我们将探讨如何在实际应用中使用YOLO进行分割。我们将讨论的主题包括:
- 选择预训练的YOLO模型
- 训练YOLO模型
- 评估模型
为什么使用YOLO进行分割?
使用YOLO进行分割有各种好处。YOLO模型速度快,适用于实时使用:
- 速度:YOLO模型非常快,适用于实时应用。
- 准确性:YOLO模型也非常准确,在许多分割基准测试中取得了最先进的结果。
- 鲁棒性:YOLO模型对噪声和遮挡具有鲁棒性,适用于具有挑战性的现实世界环境。
YOLO分割的实际应用
YOLO分割具有各种实际应用,包括医学成像和机器人技术:
- 医学成像:YOLO图像分析可以识别医学图像中的肿瘤和其他异常。这些数据可以帮助医生诊断疾病并制定治疗计划。
- 机器人技术:YOLO分割可以用于将区域中的对象分开,以便机器人可以安全高效地与它们交互。例如,机器人可以应用YOLO分割来选择和放置存储设施中的物品,或者探索拥挤的环境。
- 自动驾驶:YOLO分割可以分割道路上的汽车、行人和其他物体,从而帮助自动驾驶汽车安全导航。
如何在图像和视频中使用YOLO
步骤1:安装必要的库
pip install opencv-python ultralytics
步骤2:导入库
from ultralytics import YOLOimport random import cv2 import numpy as np
步骤3:选择您的模型
model = YOLO("yolov8m-seg.pt")
您可以在此网站上比较不同的模型并权衡它们各自的优缺点:
https://docs.ultralytics.com/tasks/segment/#models
在这种情况下,我们选择了yolov8m-seg.pt。
步骤4:使用YOLOv8分割图像中的对象
img = cv2.imread("YourImagePath") # if you want all classes yolo_classes = list(model.names.values()) classes_ids = [yolo_classes.index(clas) for clas in yolo_classes] conf = 0.5 results = model.predict(img, conf=conf) colors = [random.choices(range(256), k=3) for _ in classes_ids] print(results) for result in results: for mask, box in zip(result.masks.xy, result.boxes): points = np.int32([mask]) # cv2.polylines(img, points, True, (255, 0, 0), 1) color_number = classes_ids.index(int(box.cls[0])) cv2.fillPoly(img, points, colors[color_number])
步骤5:保存和绘制结果图像
cv2.imshow("Image", img) cv2.waitKey(0) cv2.imwrite("YourSavePath", img)
完整的代码如下:
from ultralytics import YOLO import random import cv2 import numpy as np model = YOLO("yolov8m-seg.pt") img = cv2.imread("YourImagePath") # if you want all classes yolo_classes = list(model.names.values()) classes_ids = [yolo_classes.index(clas) for clas in yolo_classes] conf = 0.5 results = model.predict(img, conf=conf) colors = [random.choices(range(256), k=3) for _ in classes_ids] print(results) for result in results: for mask, box in zip(result.masks.xy, result.boxes): points = np.int32([mask]) # cv2.polylines(img, points, True, (255, 0, 0), 1) color_number = classes_ids.index(int(box.cls[0])) cv2.fillPoly(img, points, colors[color_number]) cv2.imshow("Image", img) cv2.waitKey(0) cv2.imwrite("YourSavePath", img)