Skip to content

Latest commit

 

History

History
284 lines (241 loc) · 10.1 KB

general_segmentation.md

File metadata and controls

284 lines (241 loc) · 10.1 KB

天空分割/衣物分割/头发分割/动物分割/高质量人像分割/快速人像分割

一、SDK功能

通过模型生成Mask(遮罩),分离图像或视频中的目标区域与非目标区域。目前支持的目标包括天空、衣物、头发、动物(特指猫和狗)、人像

API的输入、输出对象可参考VNN 数据结构
API的执行情况(是否成功、错误原因等)可参考 VNN_Result 对应的状态码表


二、技术规格

移动端

指标 参数
支持图片格式 BGRA、RGBA、RGB、NV12、NV21、YUV420
支持架构 armeabi-v7、arm64-v8a
Android系统版本 5.0+
iOS系统版本 9.0+

PC端

指标 参数
支持图片格式 BGRA、RGBA、RGB、YUV420F
支持架构 x86(Win Only)、x86_64、arm64(MacOS Only)
Windows系统版本 Win 7+
MacOS系统版本 10.10+

三、资源依赖

3.1 头文件

vnn_general.h
vnn_kit.h
vnn_define.h

3.2 模型文件

高质量人像分割

seg_portrait_picture[1.0.0].vnnmodel
seg_portrait_picture[1.0.0]_process_config.json

快速人像分割

seg_portrait_video[1.0.0].vnnmodel
seg_portrait_video[1.0.0]_process_config.json

头发分割

hair_segment[1.0.0].vnnmodel
hair_segment[1.0.0]_process_config.json

衣物分割

clothes_segment[1.0.0].vnnmodel
clothes_segment[1.0.0]_process_config.json

天空分割

sky_segment[1.0.0].vnnmodel
sky_segment[1.0.0]_process_config.json

动物分割

animal_segment[1.0.0].vnnmodel
animal_segment[1.0.0]_process_config.json

3.3 动态库

Android

libvnn_core.so
libvnn_kit.so
libvnn_general.so

iOS

Accelerate.framework
CoreVideo.framework
Foundation.framework
vnn_core_ios.framework
vnn_kit_ios.framework
vnn_general_ios.framework

MacOS

Accelerate.framework
CoreVideo.framework
Cocoa.framework
vnn_core_osx.framework
vnn_kit_osx.framework
vnn_general_osx.framework

Windows

vnn_core.dll
vnn_kit.dll
vnn_general.dll

四、相关说明

4.1 Demo示例

Android: 链接
iOS: 链接 Windows: 链接
MaoOS: 链接


五、API文档

5.1 初始化 VNN_Create_General

说明: 输入模型路径,完成SDK的初始化,获得用于调用后续功能的Handle

VNN_Result VNN_Create_General( VNNHandle * handle, const int argc, const void * argv[] )
参数 含义
handle 函数调用成功后记录合法的索引,用于调用后续功能,类型为VNN_Handle*,调用成功后handle数值大于0,输出
argc 输入模型文件数,类型为const int,输入
argv 每个模型文件的具体路径,类型为const char*[ ],输入

返回值: VNN_Result,具体值参见 状态码表
调用示例:

// 以动物分割为例

VNN_Handle _handle;

std::string model = _modelpath + "/animal_segment[1.0.0].vnnmodel";
std::string cfg = _modelpath + "/animal_segment_process_config.json";

const char* argv[] = {
	model.c_str(),
  cfg.c_str(),
};

const int argc = sizeof(argv)/sizeof(argv[0]);

VNN_Result ret = VNN_Create_General(&_handle, argc, argv);

5.2 执行分割功能 VNN_Apply_General_CPU

说明: 输入包含人脸的图像,输出检测结果

VNN_Result VNN_Apply_General_CPU(VNNHandle handle, const void* in_image, const void* face_data, void* output)
参数 含义
handle SDK实例索引,类型为VNN_Handle,输入
in_image 输入图像,类型为 VNN_Image*,输入
face_data 该参数固定为NULL
output 检测结果,类型为 VNN_ImageArr*,输出

返回值: VNN_Result,具体值参见 状态码表
调用示例:

// input:完整的图像或视频帧,类型VNN_IMAGE

// 申请Buffer
// IMG_WIDTH、IMG_HEIGHT、IMG_CHANNEL不同分割模型存在差异,具体值见下表
if (!_imgBuffer) {
    _imgBuffer = (unsigned char *) malloc(IMG_CHANNEL * IMG_HEIGHT * IMG_WIDTH);
}

// 设置用于接收输出结果的对象
VNN_ImageArr output;
output.imgsNum = 1;
output.imgsArr[0].width = IMG_WIDTH; // 输出图像的宽
output.imgsArr[0].height = IMG_HEIGHT; // 输出图像的高
output.imgsArr[0].channels = IMG_CHANNEL; // 输出图像的通道
output.imgsArr[0].pix_fmt = VNN_PIX_FMT_GRAY8; // 输出图像格式为单通道,unsigned char
output.imgsArr[0].data = _imgBuffer;

// 对于分割模型,接口第三个参数固定为NULL
VNN_Apply_General_CPU(_handle, input, NULL, output);

各分割模型输出图像参数

风格 IMG_CHANNEL IMG_HEIGHT IMG_WIDTH
天空分割 1 512 512
衣物分割 1 512 384
头发分割 1 384 256
动物分割 1 512 384
高质量人像分割 1 512 384
快速人像分割 1 128 128

5.3 资源释放 VNN_Destroy_General

说明: 不再使用SDK,释放内存等资源

VNN_Result VNN_Destroy_General(VNNHandle* handle)
参数 含义
handle SDK实例索引,成功释放资源后将被修改为0(无效值),类型为VNN_Handle*,输入&输出

返回值: VNN_Result,具体值参见 状态码表
调用示例:

VNN_Result ret = VNN_Destroy_General(&_handle);

5.4 设置参数 VNN_Set_General_Attr

说明: 设定SDK实例的运行参数

VNN_Result VNN_Set_General_Attr( VNNHandle handle, const char * name, const void * value )
参数 含义
handle SDK实例索引,类型为VNN_Handle,输入
name 属性名,类型const char*,输入
value 属性值,类型参见下表,输入

合法属性名和属性值

属性名 属性含义 属性值 属性值类型
暂时为空

返回值: VNN_Result,具体值参见 状态码表
调用示例:

// 暂时为空

5.5 获取参数 VNN_Get_General_Attr

说明: 获取SDK实例的运行参数

VNN_Result VNN_Get_General_Attr( VNNHandle handle, const char * name, const void * value )
参数 含义
handle SDK实例索引,类型为VNN_Handle,输入
name 属性名,类型const char*,输入
value 属性值,类型参见下表,输出

合法属性名和属性值

属性名 属性含义 属性值 属性值类型
_has_sky (仅天空分割适用) 获取分割图像上是否存在天空的信息,若不存在则分割结果不可信,应抛弃 0(图像不存在天空)、1(图像存在天空) int*

返回值: VNN_Result,具体值参见 状态码表
调用示例:

// 获取分割图像上是否存在天空的信息
// 调用VNN_Apply_General_CPU获取分割图像后,再调用下述函数
int _has_sky;
VNN_Result ret = VNN_Get_Gneneral_Attr(_handle, "_has_sky", &_has_sky);

六、更新记录

版本 日期 更新说明
v1.0.0 2021.12.07 初次发布