模型压缩-slim¶

计算参数敏感度¶

paddlex.slim.cal_params_sensitivities(model, save_file, eval_dataset, batch_size=8)

计算模型中可裁剪参数在验证集上的敏感度，并将敏感度信息保存至文件save_file

获取模型中可裁剪卷积Kernel的名称。
计算每个可裁剪卷积Kernel不同裁剪率下的敏感度。【注意】卷积的敏感度是指在不同裁剪率下评估数据集预测精度的损失，通过得到的敏感度，可以决定最终模型需要裁剪的参数列表和各裁剪参数对应的裁剪率。查看使用示例查看裁剪教程

参数¶

model (paddlex.cls.models/paddlex.det.models/paddlex.seg.models): paddlex加载的模型。
save_file (str): 计算的得到的sensetives文件存储路径。
eval_dataset (paddlex.datasets): 评估数据集的读取器。
batch_size (int): 评估时的batch_size大小。

导出量化模型¶

paddlex.slim.export_quant_model(model, test_dataset, batch_size=2, batch_num=10, save_dir='./quant_model', cache_dir='./temp')

导出量化模型，该接口实现了Post Quantization量化方式，需要传入测试数据集，并设定batch_size和batch_num，模型会以batch_size的大小计算batch_num批样本数据，并以这些样本数据的计算结果为统计信息进行模型量化。

参数¶

model(paddlex.cls.models/paddlex.det.models/paddlex.seg.models): paddlex加载的模型。
test_dataset(paddlex.dataset): 测试数据集
batch_size(int): 进行前向计算时的批数据大小
batch_num(int): 进行向前计算时批数据数量
save_dir(str): 量化后模型的保存目录
cache_dir(str): 量化过程中的统计数据临时存储目录

使用示例¶

点击下载如下示例中的模型，数据集

import paddlex as pdx
model = pdx.load_model('vegetables_mobilenet')
test_dataset = pdx.datasets.ImageNet(
                    data_dir='vegetables_cls',
                    file_list='vegetables_cls/train_list.txt',
                    label_list='vegetables_cls/labels.txt',
                    transforms=model.eval_transforms)
pdx.slim.export_quant_model(model, test_dataset, save_dir='./quant_mobilenet')