模型微调

佚名 5年前 (2020-03-04) 人工智能 651人围观抢沙发百度已收录

模型微调

迁移学习（transfer learning）

定义：将从源数据集学到的知识迁移到目标数据集
原因：在源数据集训练的模型可以抽取通用的特征（边缘，形状，纹理等）

迁移常用技术-微调（fine tuning）

在源数据集上训练一个神经网络模型
目标模型复制除输出层之外的所有模型设计及其参数
为目标模型添加一个输出大小为目标数据集类别个数的输出层
目标模型输出层从头训练，其余层参数基于源模型微调

SRE实战互联网时代守护先锋，助力企业售后服务体系运筹帷幄！一键直达领取阿里云限量特价优惠。

在使用预训练模型时，一定要和预训练时作同样的预处理。
如果你使用的是torchvision的models，那就要求: All pre-trained models expect input images normalized in the same way, i.e. mini-batches of 3-channel RGB images of shape (3 x H x W), where H and W are expected to be at least 224. The images have to be loaded in to a range of [0, 1] and then normalized using mean = [0.485, 0.456, 0.406] and std = [0.229, 0.224, 0.225].