飞桨针对不同场景,提供了多个预测引擎部署模型(如下图),更多详细信息请参考文档。
本文档介绍使用Paddle Inference的Python接口在服务器端(NV GPU或者X86 CPU)部署分割模型。大家通过一定的配置,加上少量的代码,即可把模型集成到自己的服务中,完成图像分割的任务。
请使用模型导出工具导出您的模型, 或点击下载我们的样例模型用于测试。
接着准备一张测试图片用于试验效果,我们提供了cityscapes验证集中的一张图片用于演示效果,如果您的模型是使用其他数据集训练的,请自行准备测试图片。
在终端输入以下命令进行预测:
python deploy/python/infer.py --config /path/to/deploy.yaml --image_path /path/to/image/path/or/dir
参数说明如下:
参数名 | 用途 | 是否必选项 | 默认值 |
---|---|---|---|
config | 导出模型时生成的配置文件, 而非configs目录下的配置文件 | 是 | - |
image_path | 预测图片的路径或者目录或者文件列表 | 是 | - |
batch_size | 单卡batch size | 否 | 1 |
save_dir | 保存预测结果的目录 | 否 | output |
device | 预测执行设备,可选项有'cpu','gpu' | 否 | 'gpu' |
use_trt | 是否开启TensorRT来加速预测 | 否 | False |
precision | 启动TensorRT预测时的数值精度,可选项有'fp32','fp16','int8' | 否 | 'fp32' |
cpu_threads | 使用cpu预测的线程数 | 否 | 10 |
enable_mkldnn | 是否使用MKL-DNN加速cpu预测 | 否 | False |
benchmark | 是否产出日志,包含环境、模型、配置、性能信息 | 否 | False |
with_argmax | 对预测结果进行argmax操作 | 否 | 否 |
注意