-
本教程旨在介绍如何通过使用PaddleSeg提供的
PSPNET
预训练模型在自定义数据集上进行训练 -
本教程的所有命令都基于PaddleSeg主目录进行执行
我们提前准备好了一份数据集,通过以下代码进行下载
python dataset/download_pet.py
关于PaddleSeg支持的所有预训练模型的列表,我们可以从模型组合中查看我们所需模型的名字和配置。
接着下载对应的预训练模型
python pretrained_model/download_model.py pspnet50_bn_cityscapes
接着我们需要确定相关配置,从本教程的角度,配置分为三部分:
- 数据集
- 训练集主目录
- 训练集文件列表
- 测试集文件列表
- 评估集文件列表
- 预训练模型
- 预训练模型名称
- 预训练模型的backbone网络
- 预训练模型的Normalization类型
- 预训练模型路径
- 优化策略
- 学习率
- Batch Size
- ...
在三者中,预训练模型的配置尤为重要,如果模型或者BACKBONE配置错误,会导致预训练的参数没有加载,进而影响收敛速度。预训练模型相关的配置如第二步所示。
数据集的配置和数据路径有关,在本教程中,数据存放在dataset/mini_pet
中
其他配置则根据数据集和机器环境的情况进行调节,最终我们保存一个如下内容的yaml配置文件,存放路径为configs/test_pet.yaml
# 数据集配置
DATASET:
DATA_DIR: "./dataset/mini_pet/"
NUM_CLASSES: 3
TEST_FILE_LIST: "./dataset/mini_pet/file_list/test_list.txt"
TRAIN_FILE_LIST: "./dataset/mini_pet/file_list/train_list.txt"
VAL_FILE_LIST: "./dataset/mini_pet/file_list/val_list.txt"
VIS_FILE_LIST: "./dataset/mini_pet/file_list/test_list.txt"
# 预训练模型配置
MODEL:
MODEL_NAME: "pspnet"
DEFAULT_NORM_TYPE: "bn"
PSPNET:
DEPTH_MULTIPLIER: 1
LAYERS: 50
# 其他配置
TRAIN_CROP_SIZE: (512, 512)
EVAL_CROP_SIZE: (512, 512)
AUG:
AUG_METHOD: "unpadding"
FIX_RESIZE_SIZE: (512, 512)
BATCH_SIZE: 4
TRAIN:
PRETRAINED_MODEL_DIR: "./pretrained_model/pspnet50_bn_cityscapes/"
MODEL_SAVE_DIR: "./saved_model/pspnet_pet/"
SNAPSHOT_EPOCH: 10
TEST:
TEST_MODEL: "./saved_model/pspnet_pet/final"
SOLVER:
NUM_EPOCHS: 100
LR: 0.005
LR_POLICY: "poly"
OPTIMIZER: "sgd"
在开始训练和评估之前,我们还需要对配置和数据进行一次校验,确保数据和配置是正确的。使用下述命令启动校验流程
python pdseg/check.py --cfg ./configs/test_pet.yaml
校验通过后,使用下述命令启动训练
python pdseg/train.py --use_gpu --cfg ./configs/test_pet.yaml
模型训练完成,使用下述命令启动评估
python pdseg/eval.py --use_gpu --cfg ./configs/test_pet.yaml
预训练模型名称 | BackBone | Norm | 数据集 | 配置 |
---|---|---|---|---|
pspnet50_bn_cityscapes | ResNet50 | bn | Cityscapes | MODEL.MODEL_NAME: pspnet MODEL.DEFAULT_NORM_TYPE: bn MODEL.PSPNET.LAYERS: 50 |
pspnet101_bn_cityscapes | ResNet101 | bn | Cityscapes | MODEL.MODEL_NAME: pspnet MODEL.DEFAULT_NORM_TYPE: bn MODEL.PSPNET.LAYERS: 101 |