torchvision.models
译者:BXuan694
models子包定义了以下模型架构:
你可以通过调用以下构造函数构造随机权重的模型:
import torchvision.models as models
resnet18 = models.resnet18()
alexnet = models.alexnet()
vgg16 = models.vgg16()
squeezenet = models.squeezenet1_0()
densenet = models.densenet161()
inception = models.inception_v3()
我们在torch.utils.model_zoo
中提供了预训练模型。预训练模型可以通过传递参数pretrained=True
构造:
import torchvision.models as models
resnet18 = models.resnet18(pretrained=True)
alexnet = models.alexnet(pretrained=True)
squeezenet = models.squeezenet1_0(pretrained=True)
vgg16 = models.vgg16(pretrained=True)
densenet = models.densenet161(pretrained=True)
inception = models.inception_v3(pretrained=True)
定义预训练模型时会把权值下载到一个缓存文件夹中,这个缓存文件可以通过环境变量TORCH_MODEL_ZOO
来指定。更多细节见torch.utils.model_zoo.load_url()
。
有些模型在训练和测试阶段用到了不同的模块,例如批标准化(batch normalization)。使用model.train()
或model.eval()
可以切换到相应的模式。更多细节见train()
或eval()
。
所有的预训练模型都要求输入图片以相同的方式进行标准化,即:小批(mini-batch)三通道RGB格式(3 x H x W),其中H和W不得小于224。图片加载时像素值的范围应在[0, 1]内,然后通过指定mean = [0.485, 0.456, 0.406]
和std = [0.229, 0.224, 0.225]
进行标准化,例如:
normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406],
std=[0.229, 0.224, 0.225])
在imagenet的示例中可以看到标准化的一个应用。
下表是ImageNet单次224x224中心裁剪的错误率。
网络 | Top-1错误率(%) | Top-5错误率(%) |
---|---|---|
AlexNet | 43.45 | 20.91 |
VGG-11 | 30.98 | 11.37 |
VGG-13 | 30.07 | 10.75 |
VGG-16 | 28.41 | 9.62 |
VGG-19 | 27.62 | 9.12 |
带有批标准化的VGG-11 | 29.62 | 10.19 |
带有批标准化的VGG-13 | 28.45 | 9.63 |
带有批标准化的VGG-16 | 26.63 | 8.50 |
带有批标准化的VGG-19 | 25.76 | 8.15 |
ResNet-18 | 30.24 | 10.92 |
ResNet-34 | 26.70 | 8.58 |
ResNet-50 | 23.85 | 7.13 |
ResNet-101 | 22.63 | 6.44 |
ResNet-152 | 21.69 | 5.94 |
SqueezeNet 1.0 | 41.90 | 19.58 |
SqueezeNet 1.1 | 41.81 | 19.38 |
Densenet-121 | 25.35 | 7.83 |
Densenet-169 | 24.00 | 7.00 |
Densenet-201 | 22.80 | 6.43 |
Densenet-161 | 22.35 | 6.20 |
Inception v3 | 22.55 | 6.44 |
Alexnet
torchvision.models.alexnet(pretrained=False, **kwargs)
AlexNet模型,参见论文《One weird trick…》 。
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
VGG
torchvision.models.vgg11(pretrained=False, **kwargs)
VGG11模型。(论文中的“A”模型)
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
torchvision.models.vgg11_bn(pretrained=False, **kwargs)
VGG11模型,带有批标准化。(论文中的“A”模型)
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
torchvision.models.vgg13(pretrained=False, **kwargs)
VGG13模型。(论文中的“B”模型)
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
torchvision.models.vgg13_bn(pretrained=False, **kwargs)
VGG13模型,带有批标准化。(论文中的“B”模型)
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
torchvision.models.vgg16(pretrained=False, **kwargs)
VGG16模型。(论文中的“D”模型)
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
torchvision.models.vgg16_bn(pretrained=False, **kwargs)
VGG16模型,带有批标准化。(论文中的“D”模型)
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
torchvision.models.vgg19(pretrained=False, **kwargs)
VGG19模型。(论文中的“E”模型)
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
torchvision.models.vgg19_bn(pretrained=False, **kwargs)
VGG19模型,带有批标准化。(论文中的“E”模型)
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
ResNet
torchvision.models.resnet18(pretrained=False, **kwargs)
构造ResNet-18模型。
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
torchvision.models.resnet34(pretrained=False, **kwargs)
构造ResNet-34模型。
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
torchvision.models.resnet50(pretrained=False, **kwargs)
构造ResNet-50模型。
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
torchvision.models.resnet101(pretrained=False, **kwargs)
构造ResNet-101模型。
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
torchvision.models.resnet152(pretrained=False, **kwargs)
构造ResNet-152模型。
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
SqueezeNet
torchvision.models.squeezenet1_0(pretrained=False, **kwargs)
SqueezeNet模型,参见论文《SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and <0.5MB model size》。
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
torchvision.models.squeezenet1_1(pretrained=False, **kwargs)
SqueezeNet 1.1模型,参见SqueezeNet官方仓库。SqueezeNet 1.1比SqueezeNet 1.0节约2.4倍的计算量,参数也略少,然而精度未做牺牲。
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
DenseNet
torchvision.models.densenet121(pretrained=False, **kwargs)
Densenet-121模型,参见《Densely Connected Convolutional Networks》。
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
torchvision.models.densenet169(pretrained=False, **kwargs)
Densenet-169模型,参见《Densely Connected Convolutional Networks》。
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
torchvision.models.densenet161(pretrained=False, **kwargs)
Densenet-161模型,参见《Densely Connected Convolutional Networks》。
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
torchvision.models.densenet201(pretrained=False, **kwargs)
Densenet-201模型,参见《Densely Connected Convolutional Networks》。
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|
Inception v3
torchvision.models.inception_v3(pretrained=False, **kwargs)
Inception v3模型,参见《Rethinking the Inception Architecture for Computer Vision》。
参数: | pretrained (bool) – 如果设置为True,返回ImageNet预训练模型 |
---|---|