torchvision主要包含以下三部分: models:提供深度学习中各种经典的网络结构以及训练好的模型,包括AlexNet,VGG系列、ResNet系列、Inception系列等; datasets:提供常用的数据集加载,设计上都是继承torch.utils.data.Dataset,主要包括MMIST、CIFAR10/100、ImageNet、COCO等; transforms:提供常用的数据预处理操作,主要包括对Tensor及PILImage对象的操作。