数据集转换¶
当前PaddleX GUI支持ImageNet格式的图像分类数据集、VOC格式的目标检测数据集、COCO格式的实例分割数据集、Seg格式的语义分割的数据集,当使用LabelMe、EasyData、标注精灵这3个工具标注数据时,PaddleX提供了相应接口可将数据转换成与PaddleX GUI想适配的数据集,使用方式如下所示:
import paddlex as pdx
# 该接口实现LabelMe数据集到VOC数据集的转换。
# image_dir为图像文件存放的路径。
# json_dir为与每张图像对应的json文件的存放路径。
# dataset_save_dir为转换后数据集存放路径。
pdx.tools.labelme2voc(image_dir='labelme_imgs',
json_dir='labelme_jsons',
dataset_save_dir='voc_dataset')
可替换labelme2voc实现不同数据集间的转换,目前提供的转换接口如下:
接口 | 转换关系 |
---|---|
labelme2voc | LabelMe数据集转换为VOC数据集 |
labelme2coco | LabelMe数据集转换为COCO数据集 |
labelme2seg | LabelMe数据集转换为Seg数据集 |
easydata2imagenet | EasyData数据集转换为ImageNet数据集 |
easydata2voc | EasyData数据集转换为VOC数据集 |
easydata2coco | EasyData数据集转换为COCO数据集 |
easydata2seg | EasyData数据集转换为Seg数据集 |
jingling2seg | 标注精灵数据集转换为Seg数据集 |