训练实例分割模型¶

本文档训练代码可直接下载代码tutorials/train/detection/mask_rcnn_r50_fpn.py。

1.下载并解压训练所需的数据集

使用1张显卡训练并指定使用0号卡。

import os
os.environ['CUDA_VISIBLE_DEVICES'] = '0'
import paddlex as pdx

这里使用小度熊分拣数据集，训练集、验证集和测试共包含21个样本，1个类别。

xiaoduxiong_dataset = 'https://bj.bcebos.com/paddlex/datasets/xiaoduxiong_ins_det.tar.gz'
pdx.utils.download_and_decompress(xiaoduxiong_dataset, path='./')

2.定义训练和验证过程中的数据处理和增强操作

在训练过程中使用RandomHorizontalFlip进行数据增强，由于接下来选择的模型是带FPN结构的Mask RCNN，所以使用PaddingImage将输入图像的尺寸补齐到32的倍数，以保证FPN中两个需做相加操作的特征层的尺寸完全相同。transforms的使用见paddlex.cv.transforms

from paddlex.det import transforms
train_transforms = transforms.Compose([
    transforms.RandomHorizontalFlip(),
    transforms.Normalize(),
    transforms.ResizeByShort(short_size=800, max_size=1333),
    transforms.Padding(coarsest_stride=32)
])

eval_transforms = transforms.Compose([
    transforms.Normalize(),
    transforms.ResizeByShort(short_size=800, max_size=1333),
    transforms.Padding(coarsest_stride=32)
])

3.创建数据集读取器，并绑定相应的数据预处理流程

数据集读取器的介绍见文档paddlex.datasets

train_dataset = pdx.datasets.CocoDetection(
    data_dir='xiaoduxiong_ins_det/JPEGImages',
    ann_file='xiaoduxiong_ins_det/train.json',
    transforms=train_transforms,
    shuffle=True)
eval_dataset = pdx.datasets.CocoDetection(
    data_dir='xiaoduxiong_ins_det/JPEGImages',
    ann_file='xiaoduxiong_ins_det/val.json',
    transforms=eval_transforms)

4.创建Mask RCNN模型，并进行训练

创建带FPN结构的Mask RCNN模型，num_classes 需要设置为包含背景类的类别数，即: 目标类别数量(1) + 1。

num_classes = len(train_dataset.labels)
model = pdx.det.MaskRCNN(num_classes=num_classes

模型训练默认下载并使用在ImageNet数据集上训练得到的Backone，用户也可自行指定pretrain_weights参数来设置预训练权重。训练过程每间隔save_interval_epochs会在save_dir保存一次模型，与此同时也会在验证数据集上计算指标。检测模型的接口可见文档paddlex.det.models。

model.train(
    num_epochs=12,
    train_dataset=train_dataset,
    train_batch_size=1,
    eval_dataset=eval_dataset,
    learning_rate=0.00125,
    warmup_steps=10,
    lr_decay_epochs=[8, 11],
    save_dir='output/mask_rcnn_r50_fpn',
    use_vdl=True)

将use_vdl设置为True时可使用VisualDL查看训练指标。按以下方式启动VisualDL后，浏览器打开 https://0.0.0.0:8001即可。其中0.0.0.0为本机访问，如为远程服务, 改成相应机器IP。

visualdl --logdir output/faster_rcnn_r50_fpn/vdl_log --port 8001

5.验证或测试

训练完利用模型可继续在验证集上进行验证。

eval_metrics = model.evaluate(eval_dataset, batch_size=1)
print("eval_metrics:", eval_metrics)

结果输出：

eval_metrics: OrderedDict([('bbox_mmap', 0.5038283828382838), ('segm_mmap', 0.7025202520252025)])

训练完用模型对图片进行测试。

predict_result = model.predict('./xiaoduxiong_ins_det/JPEGImages/WechatIMG114.jpeg')

可视化测试结果：

pdx.det.visualize('./xiaoduxiong_ins_det/JPEGImages/WechatIMG114.jpeg', predict_result, threshold=0.7, save_dir='./output/mask_rcnn_r50_fpn')

../../_images/visualized_maskrcnn.jpeg