训练自定义数据集 YOLOv8 OBB :定向边界框

开发 后端
定向边界框目标检测指的是在图像或视频中识别和定位对象的同时,还估计它们的方向。这种方法在处理有一定旋转或方向变化的对象时特别有用,例如汽车、飞机或文本。

YOLOv8 定向目标检测

什么是定向边界框目标检测?

“定向边界框目标检测”指的是在图像或视频中识别和定位对象的同时,还估计它们的方向。这种方法在处理有一定旋转或方向变化的对象时特别有用,例如汽车、飞机或文本。

定向目标检测器的输出是一组旋转的边界框,这些框精确地包围图像中的对象,每个框都有类别标签和置信度分数。当您需要识别场景中感兴趣的对象,但不需要知道对象的确切位置或确切形状时,目标检测是一个不错的选择。

来源:https://mediaan.com/mediaan-blog/oriented-object-detection

如何加载 YOLOv8 OBB 模型?

# install ultralytics

pip3 install ultralytics
from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-obb.pt')  # load an official model

# Predict with the model
results = model('https://miro.medium.com/v2/resize:fit:1400/1*BybWklt3t0M8zdSXtkipRg.png', save=True)  # predict on an image

obb 结果

如何训练自定义数据集?

数据集格式

YOLO OBB 格式通过它们的四个角点指定边界框,坐标值在 0 和 1 之间归一化。它遵循这种格式:

class_index, x1, y1, x2, y2, x3, y3, x4, y4

内部,YOLO 以 xywhr 格式处理损失和输出,这表示边界框的中心点(xy)、宽度、高度和旋转。

来源:https://docs.ultralytics.com/datasets/obb/#yolo-obb-format

使用 Roboflow YOLOv8 OBB 数据集格式。在本教程中,我使用了一个公共数据集,并从 Roboflow Universe 生成了 obb 格式。

来源:https://universe.roboflow.com/ 

数据集链接:https://universe.roboflow.com/prata-vqsjq/dosr/dataset/3

导出数据集到 YOLOv8 定向边界框格式:

标签

 0: cargo
  1: container
  2: cruise
  3: fishing boat
  4: military_ship
  5: tanker

如何训练?


# Train the model
epochs = 20

imgsz = 640
batch = 16
save_period = 5
device = 0
cache = False
pretrained = True
YAML_FILE = '/content/datasets/data.yaml'
project = 'obb'
name = 'custom_obb'

model.train(
    data=YAML_FILE,
    device=device,
    epochs=epochs,
    imgsz=imgsz,
    batch=batch,
    cache=cache,
    save_period=save_period,
    project=project,
    name=name,
    patience=0,
    augment=False
)

训练过程将运行 20 个epoch,每批 16 张图像,图像大小为 640 像素。脚本每 5 个epoch保存一次训练好的模型,并使用 GPU 进行训练(device=0)。训练过程中不使用缓存(cache=False)。训练过程不使用预训练权重(pretrained=False)且不使用数据增强(augment=False)。项目名为‘obb’,训练好的模型将保存为‘custom_obb’。

结果

责任编辑:赵宁宁 来源: 小白玩转Python
相关推荐

2024-07-01 12:55:50

2024-10-25 08:30:57

计算机视觉神经网络YOLOv8模型

2023-01-12 12:20:29

YOLOv8模型

2024-07-09 08:50:23

2020-10-05 21:57:17

GitHub 开源开发

2023-09-12 13:59:41

OpenAI数据集

2024-11-06 16:56:51

2024-01-29 09:29:02

计算机视觉模型

2024-05-15 09:16:05

2024-07-22 13:49:38

YOLOv8目标检测开发

2024-10-07 11:12:55

2009-08-17 17:24:02

C#自定义消息框

2024-10-14 17:43:05

2015-02-12 15:33:43

微信SDK

2009-04-23 09:05:08

IE8llq自定义功能

2015-02-12 15:38:26

微信SDK

2024-07-11 08:25:34

2009-08-28 17:45:19

C#自定义数据

2020-12-08 12:05:48

Golang GinW框架HTTPS

2024-01-05 15:28:06

鸿蒙数据同步GlobalThis
点赞
收藏

51CTO技术栈公众号