Python实现机器学习中目标检测的详细教程【教程】

舞夢輝影 2025-12-18 00:00:00 次阅读

目标检测需同时识别物体类别和定位边界框；推荐用YOLOv8（Ultralytics）+自定义数据集入门，按YOLO格式组织数据、用LabelImg标注、编写data.yaml配置、一行命令训练、三行代码推理并可视化结果。

目标检测不是分类也不是单纯定位，而是既要识别图像中有哪些物体（类别），又要标出它们的位置（边界框）。Python生态里最实用的入门路径是用 YOLOv8（Ultralytics 实现）+ 自定义数据集，不依赖复杂环境配置，代码简洁、训练快、效果稳。

准备数据：按YOLO格式组织图像和标注

YOLO要求每张图对应一个同名 .txt 文件，每行描述一个目标：类别索引 x_center y_center width height（归一化到 0~1）。比如一张 640×480 图片里有个猫，框左上(100,80)、宽200、高150，则中心点为 (200,155)，归一化后是 0 0.3125 0.3229 0.3125 0.3125（类别0=cat）。

建议操作：

用 LabelImg 或 CVAT 标注图像，导出为 YOLO 格式
目录结构统一为：dataset/images/train/、dataset/labels/train/、dataset/images/val/、dataset/labels/val/
写个简单脚本检查 .txt 是否缺失、坐标是否越界（x,y,w,h 都应在 [0,1] 内）

安装与加载模型：一行命令启动训练

Ultralytics 的 YOLOv8 封装极好，无需手动写 Dataloader 或 Loss 函数。

执行：

pip install ultralytics

然后直接调用预训练模型开始微调：

from ultralytics import YOLO
加载预训练权重（自动下载）
model = YOLO('yolov8n.pt')  # nano 版，轻量适合入门
训练（指定数据配置文件 + 超参）
model.train(
data='dataset/data.yaml',  # 包含 train/val 路径和 nc/classes 的 YAML
epochs=50,
imgsz=640,
batch=16,
name='my_cat_detector'
)

data.yaml 示例：

train: ../dataset/images/train
val: ../dataset/images/val
nc: 1
names: ['cat']

推理与可视化：三行代码跑通检测流程

训练完模型会保存在 runs/detect/my_cat_detector/weights/best.pt，直接加载即可预测：

model = YOLO('runs/detect/my_cat_detector/weights/best.pt')
results = model('test.jpg')  # 返回 Results 对象
results[0].show()  # 弹窗显示带框结果

若需提取结果：

boxes = results[0].boxes → 获取 xyxy 坐标、置信度、类别
cls = boxes.cls.tolist()、conf = boxes.conf.tolist()、xyxy = boxes.xyxy.tolist()
用 OpenCV 或 matplotlib 自定义画框、加标签、保存图像