Pytorch 深度学习实战教程（五）：今天，你垃圾分类了吗？

点击上方“Jack Cui”，选择“加为星标”

第一时间关注技术干货！

垃圾分类

还记得去年，上海如火如荼进行的垃圾分类政策吗？

2020年5月1日起，北京也开始实行「垃圾分类」了！

北京的垃圾分类标准与上海略有差别，垃圾分为厨余垃圾、可回收物、有害垃圾和其他垃圾四大类，分别对应四种不同颜色的垃圾桶，即绿色、蓝色、红色和灰色。

继上海之后，北京也迈入了“垃圾强制分类时代”。

垃圾分类，最变态的地方还是日本。

日本把垃圾分为资源、可燃、不可燃、危险、塑料、金属和粗大，这 7 大类垃圾。

并规定了回收站每天允许回收的垃圾种类，比如如周一收资源的，周二收塑料的。居民要在指定时间、指定地点丢垃圾。像桌子衣柜这些大件垃圾还要交钱才能扔。

敢乱扔垃圾的垃圾最多还可能吃 5 年牢饭并罚上 1000 万日元！

不过，有 24 小时在线发牌打理家务的家庭主妇，人家可以每天花上半小时去搞垃圾分类，然后照样有时间去刷刷抖音，打打农药，看看小电影啥的。

现在，中国一线城市的“社畜”们，干着 996 的活，又要操起“日本主妇的心”。

一家一个码农就够惨了，一家双码农那就是「惨上加惨」，下班一个比一个晚。

上海实行「垃圾分类」已经快一年了，不知近况如何？

疫情前，曾去上海玩过一次，一个很明显的感受是垃圾分类确实是井然有序地进行着，租住的民宿摆放了 4 个垃圾桶，吃剩的垃圾都需要动动脑子才知道怎么丢。

不过，也在小区附近看到，分类垃圾桶旁，随意堆放的未分类的垃圾。

北京通知开始实施「垃圾分类」快一个月了，我所居住的小区在市中心，小区内还没有见到分类垃圾箱，倒是公告张贴了很多，应该还处于宣传阶段。

不过公司里，倒是开始垃圾分类了，看来是从企业开始行动，然后再到个人。

随着政策的完善，支持力度的加大，不知若干年后，是否会出现一家提供垃圾分类服务的家政公司？

垃圾分类助手

吐槽归吐槽，人们总归要随着时代的发展而顺势前行。

好在，一些 APP 或者小程序已经为我们准备好了查询工具。

查询方式无非三种形式：文字、语音、图片。

好多家，都有类似的产品。

你可以查询「996加班掉落的头发是什么垃圾」，也可以查询「夜宵必备的小龙虾是什么垃圾」。

比如，腾讯有个微信小程序，叫「垃圾分类精灵」；

百度 APP 相机识别入口有个 tag ，叫「识垃圾」。

支付宝有个小程序，叫「垃圾分类指南」。

都支持文字、语音、图片的垃圾分类识别。

上海刚实行垃圾分类的时候，淘宝的「拍立淘」也有垃圾分类识别入口，不过现在貌似已经下线了。

垃圾分类哪家强，体验一下就知道了。

垃圾分类技术

垃圾识别背后的技术是什么呢？

文字和语音的都相对简单，文本匹配即可，语音多了一个音频转文本的步骤。

基于图片的垃圾识别就要难不少。

比如，卫生纸你可以弄成各种形状，团成一团，或者撕成一条一条。

甚至，可以把蛋糕恶趣味地做成「便便」的样子。

让算法通过图片去识别这些东西，显然有些难为算法。

目前，使用深度学习分类算法去识别垃圾种类，还是比较难做好的。

一般都是采用多级分类模型或检索，搭建的超大分类网络，比如 1 万多类物体识别，甚至 10 万。

然后根据类别标签做映射，映射到最终的垃圾类别。

底层技术实现，其实还是多分类。

垃圾分类不同于通用的图像识别，通用图像识别的「鱼」，可能是一条在水中自由自在嬉戏的金鱼。

而垃圾分类识别的「鱼」，则很可能是一个躺在餐盘里仅剩躯干骨的鱼骨头。

弄个合适的数据集，也是一门技术活。

数据集获取一般可以通过以下 3 个渠道：

写爬虫，爬各大网站的图片数据，然后使用自己的接口清洗或者人工标注；
将需求提交给数据标注团队，花经费标注数据。

前两个是要么得有技术、要么得有钱。

最后一个方法，就得碰运气了。翻论文，找公开数据集，或者去 AI 比赛网站或者 AI 开放平台碰碰运气。

比赛，比如可以去 Kaggle 搜一搜数据集。

URL：

https://www.kaggle.com/

AI 开放平台，可以去 AI Studio看看。

URL：

https://aistudio.baidu.com/aistudio/datasetoverview

在 AI Studio 我搜索到了不错的垃圾分类数据集。

一共 56528 张图片，214 类，总共 7.13 GB。

URL：

https://aistudio.baidu.com/aistudio/datasetdetail/30982

瞧，运气不错，找到了一个不错的数据集。

下载速度也很给力，10 MB/s。

本文使用这个数据集，训练一个简单的垃圾分类模型。

数据处理

垃圾数据都放在了名字为「垃圾图片库」的文件夹里。

首先，我们需要写个脚本根据文件夹名，生成对应的标签文件（dir_label.txt）。

前面是小分类标签，后面是大分类标签。

然后再将数据集分为训练集（train.txt）、验证集（val.txt）、测试集（test.txt）。

训练集和验证集用于训练模型，测试集用于验收最终模型效果。

此外，在使用图片训练之前还需要检查下图片质量，使用 PIL 的 Image 读取，捕获 Error 和 Warning 异常，对有问题的图片直接删除即可。

写个脚本生成三个 txt 文件，训练集 48045 张，验证集 5652 张，测试集 2826 张。

脚本很简单，代码就不贴了，直接提供处理好的文件。

处理好的四个 txt 文件可以直接下载。

下载地址：

https://github.com/Jack-Cherish/Deep-Learning/tree/master/Pytorch-Seg/lesson-4

将四个 txt 文件放到和「垃圾图片库」的相同目录下即可。

有了前几篇教程的基础，写个数据读取的代码应该很轻松吧。

编写 dataset.py 读取数据，看一下效果。

<span class="code-snippet_outer">import torch</span></code><code><span class="code-snippet_outer">from PIL import Image</span></code><code><span class="code-snippet_outer">import os</span></code><code><span class="code-snippet_outer">import glob</span></code><code><span class="code-snippet_outer">from torch.utils.data import Dataset</span></code><code><span class="code-snippet_outer">import random</span></code><code><span class="code-snippet_outer">import torchvision.transforms as transforms </span></code><code><span class="code-snippet_outer">from PIL import ImageFile</span></code><code><span class="code-snippet_outer">ImageFile.LOAD_TRUNCATED_IMAGES = True</span></code><code>
</code><code><span class="code-snippet_outer">class Garbage_Loader(Dataset):</span></code><code><span class="code-snippet_outer">    def __init__(self, txt_path, train_flag=True):</span></code><code><span class="code-snippet_outer">        self.imgs_info = self.get_images(txt_path)</span></code><code><span class="code-snippet_outer">        self.train_flag = train_flag</span></code><code>
</code><code><span class="code-snippet_outer">        self.train_tf = transforms.Compose([</span></code><code><span class="code-snippet_outer">                transforms.Resize(224),</span></code><code><span class="code-snippet_outer">                transforms.RandomHorizontalFlip(),</span></code><code><span class="code-snippet_outer">                transforms.RandomVerticalFlip(),</span></code><code><span class="code-snippet_outer">                transforms.ToTensor(),</span></code><code>
</code><code><span class="code-snippet_outer">            ])</span></code><code><span class="code-snippet_outer">        self.val_tf = transforms.Compose([</span></code><code><span class="code-snippet_outer">                transforms.Resize(224),</span></code><code><span class="code-snippet_outer">                transforms.ToTensor(),</span></code><code><span class="code-snippet_outer">            ])</span></code><code>
</code><code><span class="code-snippet_outer">    def get_images(self, txt_path):</span></code><code><span class="code-snippet_outer">        with open(txt_path, 'r', encoding='utf-8') as f:</span></code><code><span class="code-snippet_outer">            imgs_info = f.readlines()</span></code><code><span class="code-snippet_outer">            imgs_info = list(map(lambda x:x.strip().split('\t'), imgs_info))</span></code><code><span class="code-snippet_outer">        return imgs_info</span></code><code>
</code><code><span class="code-snippet_outer">    def padding_black(self, img):</span></code><code>
</code><code><span class="code-snippet_outer">        w, h  = img.size</span></code><code>
</code><code><span class="code-snippet_outer">        scale = 224. / max(w, h)</span></code><code><span class="code-snippet_outer">        img_fg = img.resize([int(x) for x in [w * scale, h * scale]])</span></code><code>
</code><code><span class="code-snippet_outer">        size_fg = img_fg.size</span></code><code><span class="code-snippet_outer">        size_bg = 224</span></code><code>
</code><code><span class="code-snippet_outer">        img_bg = Image.new("RGB", (size_bg, size_bg))</span></code><code>
</code><code><span class="code-snippet_outer">        img_bg.paste(img_fg, ((size_bg - size_fg[0]) // 2,</span></code><code><span class="code-snippet_outer">                              (size_bg - size_fg[1]) // 2))</span></code><code>
</code><code><span class="code-snippet_outer">        img = img_bg</span></code><code><span class="code-snippet_outer">        return img</span></code><code>
</code><code><span class="code-snippet_outer">    def __getitem__(self, index):</span></code><code><span class="code-snippet_outer">        img_path, label = self.imgs_info[index]</span></code><code><span class="code-snippet_outer">        img = Image.open(img_path)</span></code><code><span class="code-snippet_outer">        img = img.convert('RGB')</span></code><code><span class="code-snippet_outer">        img = self.padding_black(img)</span></code><code><span class="code-snippet_outer">        if self.train_flag:</span></code><code><span class="code-snippet_outer">            img = self.train_tf(img)</span></code><code><span class="code-snippet_outer">        else:</span></code><code><span class="code-snippet_outer">            img = self.val_tf(img)</span></code><code><span class="code-snippet_outer">        label = int(label)</span></code><code>
</code><code><span class="code-snippet_outer">        return img, label</span></code><code>
</code><code><span class="code-snippet_outer">    def __len__(self):</span></code><code><span class="code-snippet_outer">        return len(self.imgs_info)</span></code><code>
</code><code>
</code><code><span class="code-snippet_outer">if __name__ == "__main__":</span></code><code><span class="code-snippet_outer">    train_dataset = Garbage_Loader("train.txt", True)</span></code><code><span class="code-snippet_outer">    print("数据个数：", len(train_dataset))</span></code><code><span class="code-snippet_outer">    train_loader = torch.utils.data.DataLoader(dataset=train_dataset,</span></code><code><span class="code-snippet_outer">                                               batch_size=1, </span></code><code><span class="code-snippet_outer">                                               shuffle=True)</span></code><code><span class="code-snippet_outer">    for image, label in train_loader:</span></code><code><span class="code-snippet_outer">        print(image.shape)</span></code><code><span class="code-snippet_outer">        print(label)</span>

import torch</code><code>from PIL import Image</code><code>import os</code><code>import glob</code><code>from torch.utils.data import Dataset</code><code>import random</code><code>import torchvision.transforms as transforms </code><code>from PIL import ImageFile</code><code>ImageFile.LOAD_TRUNCATED_IMAGES = True</code><code>

</code><code>class Garbage_Loader(Dataset):</code><code> def __init__(self, txt_path, train_flag=True):</code><code> self.imgs_info = self.get_images(txt_path)</code><code> self.train_flag = train_flag</code><code>

</code><code> self.train_tf = transforms.Compose([</code><code> transforms.Resize(224),</code><code> transforms.RandomHorizontalFlip(),</code><code> transforms.RandomVerticalFlip(),</code><code> transforms.ToTensor(),</code><code>

</code><code> ])</code><code> self.val_tf = transforms.Compose([</code><code> transforms.Resize(224),</code><code> transforms.ToTensor(),</code><code> ])</code><code>

</code><code> def get_images(self, txt_path):</code><code> with open(txt_path, 'r', encoding='utf-8') as f:</code><code> imgs_info = f.readlines()</code><code> imgs_info = list(map(lambda x:x.strip().split('\t'), imgs_info))</code><code> return imgs_info</code><code>

</code><code> def padding_black(self, img):</code><code>

</code><code> w, h = img.size</code><code>

</code><code> scale = 224. / max(w, h)</code><code> img_fg = img.resize([int(x) for x in [w * scale, h * scale]])</code><code>

</code><code> size_fg = img_fg.size</code><code> size_bg = 224</code><code>

</code><code> img_bg = Image.new("RGB", (size_bg, size_bg))</code><code>

</code><code> img_bg.paste(img_fg, ((size_bg - size_fg[0]) // 2,</code><code> (size_bg - size_fg[1]) // 2))</code><code>

</code><code> img = img_bg</code><code> return img</code><code>

</code><code> def __getitem__(self, index):</code><code> img_path, label = self.imgs_info[index]</code><code> img = Image.open(img_path)</code><code> img = img.convert('RGB')</code><code> img = self.padding_black(img)</code><code> if self.train_flag:</code><code> img = self.train_tf(img)</code><code> else:</code><code> img = self.val_tf(img)</code><code> label = int(label)</code><code>

</code><code> return img, label</code><code>

</code><code> def __len__(self):</code><code> return len(self.imgs_info)</code><code>

</code><code>

</code><code>if __name__ == "__main__":</code><code> train_dataset = Garbage_Loader("train.txt", True)</code><code> print("数据个数：", len(train_dataset))</code><code> train_loader = torch.utils.data.DataLoader(dataset=train_dataset,</code><code> batch_size=1, </code><code> shuffle=True)</code><code> for image, label in train_loader:</code><code> print(image.shape)</code><code> print(label)

读取 train.txt 文件，加载数据。数据预处理，是将图片等比例填充到尺寸为 280 * 280 的纯黑色图片上，然后再 resize 到 224 * 224 的尺寸。

这是图片分类里，很常规的一种预处理方法。

此外，针对训练集，使用 pytorch 的 transforms 添加了水平翻转和垂直翻转的随机操作，这也是很常见的一种数据增强方法。

运行结果：

OK，搞定！开始写训练代码！

垃圾分类初体验

我们使用一个常规的网络 ResNet50 ，这是一个非常常见的提取特征的网络结构。

整个训练过程也很简单，训练步骤不清楚的，可以看我上两篇教程：

创建 train.py 文件，编写如下代码：

<span class="code-snippet_outer"><span class="code-snippet__keyword">from</span> dataset <span class="code-snippet__keyword">import</span> Garbage_Loader</span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">from</span> torch.utils.data <span class="code-snippet__keyword">import</span> DataLoader</span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">from</span> torchvision <span class="code-snippet__keyword">import</span> models</span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">import</span> torch.nn <span class="code-snippet__keyword">as</span> nn</span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">import</span> torch.optim <span class="code-snippet__keyword">as</span> optim</span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">import</span> torch</span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">import</span> time</span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">import</span> os</span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">import</span> shutil</span></code><code><span class="code-snippet_outer">os.environ[<span class="code-snippet__string">"CUDA_VISIBLE_DEVICES"</span>] = <span class="code-snippet__string">"0"</span></span></code><code>
</code><code><span class="code-snippet_outer"><span class="code-snippet__string">"""</span></span></code><code><span class="code-snippet_outer">    Author : Jack Cui</span></code><code><span class="code-snippet_outer">    Wechat : https://mp.weixin.qq.com/s/OCWwRVDFNslIuKyiCVUoTA</span></code><code><span class="code-snippet_outer">"""</span></code><code>
</code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">from</span> tensorboardX <span class="code-snippet__keyword">import</span> SummaryWriter</span></code><code>
</code><code><span class="code-snippet_outer"><span class="code-snippet__function"><span class="code-snippet__keyword">def</span> <span class="code-snippet__title">accuracy</span><span class="code-snippet__params">(output, target, topk=(<span class="code-snippet__number">1</span>,))</span>:</span></span></code><code><span class="code-snippet_outer">    <span class="code-snippet__string">"""</span></span></code><code><span class="code-snippet_outer">        计算topk的准确率</span></code><code><span class="code-snippet_outer">    """</span></code><code><span class="code-snippet_outer">    <span class="code-snippet__keyword">with</span> torch.no_grad():</span></code><code><span class="code-snippet_outer">        maxk = max(topk)</span></code><code><span class="code-snippet_outer">        batch_size = target.size(<span class="code-snippet__number">0</span>)</span></code><code>
</code><code><span class="code-snippet_outer">        _, pred = output.topk(maxk, <span class="code-snippet__number">1</span>, <span class="code-snippet__keyword">True</span>, <span class="code-snippet__keyword">True</span>)</span></code><code><span class="code-snippet_outer">        pred = pred.t()</span></code><code><span class="code-snippet_outer">        correct = pred.eq(target.view(<span class="code-snippet__number">1</span>, <span class="code-snippet__number">-1</span>).expand_as(pred))</span></code><code>
</code><code><span class="code-snippet_outer">        class_to = pred[<span class="code-snippet__number">0</span>].cpu().numpy()</span></code><code>
</code><code><span class="code-snippet_outer">        res = []</span></code><code><span class="code-snippet_outer">        <span class="code-snippet__keyword">for</span> k <span class="code-snippet__keyword">in</span> topk:</span></code><code><span class="code-snippet_outer">            correct_k = correct[:k].view(<span class="code-snippet__number">-1</span>).float().sum(<span class="code-snippet__number">0</span>, keepdim=<span class="code-snippet__keyword">True</span>)</span></code><code><span class="code-snippet_outer">            res.append(correct_k.mul_(<span class="code-snippet__number">100.0</span> / batch_size))</span></code><code><span class="code-snippet_outer">        <span class="code-snippet__keyword">return</span> res, class_to</span></code><code>
</code><code><span class="code-snippet_outer"><span class="code-snippet__function"><span class="code-snippet__keyword">def</span> <span class="code-snippet__title">save_checkpoint</span><span class="code-snippet__params">(state, is_best, filename=<span class="code-snippet__string">'checkpoint.pth.tar'</span>)</span>:</span></span></code><code><span class="code-snippet_outer">    <span class="code-snippet__string">"""</span></span></code><code><span class="code-snippet_outer">        根据 is_best 存模型，一般保存 valid acc 最好的模型</span></code><code><span class="code-snippet_outer">    """</span></code><code><span class="code-snippet_outer">    torch.save(state, filename)</span></code><code><span class="code-snippet_outer">    <span class="code-snippet__keyword">if</span> is_best:</span></code><code><span class="code-snippet_outer">        shutil.copyfile(filename, <span class="code-snippet__string">'model_best_'</span> + filename)</span></code><code>
</code><code><span class="code-snippet_outer"><span class="code-snippet__function"><span class="code-snippet__keyword">def</span> <span class="code-snippet__title">train</span><span class="code-snippet__params">(train_loader, model, criterion, optimizer, epoch, writer)</span>:</span></span></code><code><span class="code-snippet_outer">    <span class="code-snippet__string">"""</span></span></code><code><span class="code-snippet_outer">        训练代码</span></code><code><span class="code-snippet_outer">        参数：</span></code><code><span class="code-snippet_outer">            train_loader - 训练集的 DataLoader</span></code><code><span class="code-snippet_outer">            model - 模型</span></code><code><span class="code-snippet_outer">            criterion - 损失函数</span></code><code><span class="code-snippet_outer">            optimizer - 优化器</span></code><code><span class="code-snippet_outer">            epoch - 进行第几个 epoch</span></code><code><span class="code-snippet_outer">            writer - 用于写 tensorboardX </span></code><code><span class="code-snippet_outer">    """</span></code><code><span class="code-snippet_outer">    batch_time = AverageMeter()</span></code><code><span class="code-snippet_outer">    data_time = AverageMeter()</span></code><code><span class="code-snippet_outer">    losses = AverageMeter()</span></code><code><span class="code-snippet_outer">    top1 = AverageMeter()</span></code><code><span class="code-snippet_outer">    top5 = AverageMeter()</span></code><code>
</code><code>    </code><code><span class="code-snippet_outer">    model.train()</span></code><code>
</code><code><span class="code-snippet_outer">    end = time.time()</span></code><code><span class="code-snippet_outer">    <span class="code-snippet__keyword">for</span> i, (input, target) <span class="code-snippet__keyword">in</span> enumerate(train_loader):</span></code><code>        </code><code><span class="code-snippet_outer">        data_time.update(time.time() - end)</span></code><code>
</code><code><span class="code-snippet_outer">        input = input.cuda()</span></code><code><span class="code-snippet_outer">        target = target.cuda()</span></code><code>
</code><code>        </code><code><span class="code-snippet_outer">        output = model(input)</span></code><code><span class="code-snippet_outer">        loss = criterion(output, target)</span></code><code>
</code><code>        </code><code><span class="code-snippet_outer">        [prec1, prec5], class_to = accuracy(output, target, topk=(<span class="code-snippet__number">1</span>, <span class="code-snippet__number">5</span>))</span></code><code><span class="code-snippet_outer">        losses.update(loss.item(), input.size(<span class="code-snippet__number">0</span>))</span></code><code><span class="code-snippet_outer">        top1.update(prec1[<span class="code-snippet__number">0</span>], input.size(<span class="code-snippet__number">0</span>))</span></code><code><span class="code-snippet_outer">        top5.update(prec5[<span class="code-snippet__number">0</span>], input.size(<span class="code-snippet__number">0</span>))</span></code><code>
</code><code>        </code><code><span class="code-snippet_outer">        optimizer.zero_grad()</span></code><code><span class="code-snippet_outer">        loss.backward()</span></code><code><span class="code-snippet_outer">        optimizer.step()</span></code><code>
</code><code>        </code><code><span class="code-snippet_outer">        batch_time.update(time.time() - end)</span></code><code><span class="code-snippet_outer">        end = time.time()</span></code><code>
</code><code><span class="code-snippet_outer">        <span class="code-snippet__keyword">if</span> i % <span class="code-snippet__number">10</span> == <span class="code-snippet__number">0</span>:</span></code><code><span class="code-snippet_outer">            print(<span class="code-snippet__string">'Epoch: [{0}][{1}/{2}]\t'</span></span></code><code><span class="code-snippet_outer">                  <span class="code-snippet__string">'Time {batch_time.val:.3f} ({batch_time.avg:.3f})\t'</span></span></code><code><span class="code-snippet_outer">                  <span class="code-snippet__string">'Data {data_time.val:.3f} ({data_time.avg:.3f})\t'</span></span></code><code><span class="code-snippet_outer">                  <span class="code-snippet__string">'Loss {loss.val:.4f} ({loss.avg:.4f})\t'</span></span></code><code><span class="code-snippet_outer">                  <span class="code-snippet__string">'Prec@1 {top1.val:.3f} ({top1.avg:.3f})\t'</span></span></code><code><span class="code-snippet_outer">                  <span class="code-snippet__string">'Prec@5 {top5.val:.3f} ({top5.avg:.3f})'</span>.format(</span></code><code><span class="code-snippet_outer">                   epoch, i, len(train_loader), batch_time=batch_time,</span></code><code><span class="code-snippet_outer">                   data_time=data_time, loss=losses, top1=top1, top5=top5))</span></code><code><span class="code-snippet_outer">    writer.add_scalar(<span class="code-snippet__string">'loss/train_loss'</span>, losses.val, global_step=epoch)</span></code><code>
</code><code><span class="code-snippet_outer"><span class="code-snippet__function"><span class="code-snippet__keyword">def</span> <span class="code-snippet__title">validate</span><span class="code-snippet__params">(val_loader, model, criterion, epoch, writer, phase=<span class="code-snippet__string">"VAL"</span>)</span>:</span></span></code><code><span class="code-snippet_outer">    <span class="code-snippet__string">"""</span></span></code><code><span class="code-snippet_outer">        验证代码</span></code><code><span class="code-snippet_outer">        参数：</span></code><code><span class="code-snippet_outer">            val_loader - 验证集的 DataLoader</span></code><code><span class="code-snippet_outer">            model - 模型</span></code><code><span class="code-snippet_outer">            criterion - 损失函数</span></code><code><span class="code-snippet_outer">            epoch - 进行第几个 epoch</span></code><code><span class="code-snippet_outer">            writer - 用于写 tensorboardX </span></code><code><span class="code-snippet_outer">    """</span></code><code><span class="code-snippet_outer">    batch_time = AverageMeter()</span></code><code><span class="code-snippet_outer">    losses = AverageMeter()</span></code><code><span class="code-snippet_outer">    top1 = AverageMeter()</span></code><code><span class="code-snippet_outer">    top5 = AverageMeter()</span></code><code>
</code><code>    </code><code><span class="code-snippet_outer">    model.eval()</span></code><code>
</code><code><span class="code-snippet_outer">    <span class="code-snippet__keyword">with</span> torch.no_grad():</span></code><code><span class="code-snippet_outer">        end = time.time()</span></code><code><span class="code-snippet_outer">        <span class="code-snippet__keyword">for</span> i, (input, target) <span class="code-snippet__keyword">in</span> enumerate(val_loader):</span></code><code><span class="code-snippet_outer">            input = input.cuda()</span></code><code><span class="code-snippet_outer">            target = target.cuda()</span></code><code>            </code><code><span class="code-snippet_outer">            output = model(input)</span></code><code><span class="code-snippet_outer">            loss = criterion(output, target)</span></code><code>
</code><code>            </code><code><span class="code-snippet_outer">            [prec1, prec5], class_to = accuracy(output, target, topk=(<span class="code-snippet__number">1</span>, <span class="code-snippet__number">5</span>))</span></code><code><span class="code-snippet_outer">            losses.update(loss.item(), input.size(<span class="code-snippet__number">0</span>))</span></code><code><span class="code-snippet_outer">            top1.update(prec1[<span class="code-snippet__number">0</span>], input.size(<span class="code-snippet__number">0</span>))</span></code><code><span class="code-snippet_outer">            top5.update(prec5[<span class="code-snippet__number">0</span>], input.size(<span class="code-snippet__number">0</span>))</span></code><code>
</code><code>            </code><code><span class="code-snippet_outer">            batch_time.update(time.time() - end)</span></code><code><span class="code-snippet_outer">            end = time.time()</span></code><code>
</code><code><span class="code-snippet_outer">            <span class="code-snippet__keyword">if</span> i % <span class="code-snippet__number">10</span> == <span class="code-snippet__number">0</span>:</span></code><code><span class="code-snippet_outer">                print(<span class="code-snippet__string">'Test-{0}: [{1}/{2}]\t'</span></span></code><code><span class="code-snippet_outer">                      <span class="code-snippet__string">'Time {batch_time.val:.3f} ({batch_time.avg:.3f})\t'</span></span></code><code><span class="code-snippet_outer">                      <span class="code-snippet__string">'Loss {loss.val:.4f} ({loss.avg:.4f})\t'</span></span></code><code><span class="code-snippet_outer">                      <span class="code-snippet__string">'Prec@1 {top1.val:.3f} ({top1.avg:.3f})\t'</span></span></code><code><span class="code-snippet_outer">                      <span class="code-snippet__string">'Prec@5 {top5.val:.3f} ({top5.avg:.3f})'</span>.format(</span></code><code><span class="code-snippet_outer">                              phase, i, len(val_loader),</span></code><code><span class="code-snippet_outer">                              batch_time=batch_time,</span></code><code><span class="code-snippet_outer">                              loss=losses,</span></code><code><span class="code-snippet_outer">                              top1=top1, top5=top5))</span></code><code>
</code><code><span class="code-snippet_outer">        print(<span class="code-snippet__string">' * {} Prec@1 {top1.avg:.3f} Prec@5 {top5.avg:.3f}'</span></span></code><code><span class="code-snippet_outer">              .format(phase, top1=top1, top5=top5))</span></code><code><span class="code-snippet_outer">    writer.add_scalar(<span class="code-snippet__string">'loss/valid_loss'</span>, losses.val, global_step=epoch)</span></code><code><span class="code-snippet_outer">    <span class="code-snippet__keyword">return</span> top1.avg, top5.avg</span></code><code>
</code><code><span class="code-snippet_outer"><span class="code-snippet__class"><span class="code-snippet__keyword">class</span> <span class="code-snippet__title">AverageMeter</span><span class="code-snippet__params">(object)</span>:</span></span></code><code><span class="code-snippet_outer">    <span class="code-snippet__string">"""Computes and stores the average and current value"""</span></span></code><code><span class="code-snippet_outer">    <span class="code-snippet__function"><span class="code-snippet__keyword">def</span> <span class="code-snippet__title">__init__</span><span class="code-snippet__params">(self)</span>:</span></span></code><code><span class="code-snippet_outer">        self.reset()</span></code><code>
</code><code><span class="code-snippet_outer">    <span class="code-snippet__function"><span class="code-snippet__keyword">def</span> <span class="code-snippet__title">reset</span><span class="code-snippet__params">(self)</span>:</span></span></code><code><span class="code-snippet_outer">        self.val = <span class="code-snippet__number">0</span></span></code><code><span class="code-snippet_outer">        self.avg = <span class="code-snippet__number">0</span></span></code><code><span class="code-snippet_outer">        self.sum = <span class="code-snippet__number">0</span></span></code><code><span class="code-snippet_outer">        self.count = <span class="code-snippet__number">0</span></span></code><code>
</code><code><span class="code-snippet_outer">    <span class="code-snippet__function"><span class="code-snippet__keyword">def</span> <span class="code-snippet__title">update</span><span class="code-snippet__params">(self, val, n=<span class="code-snippet__number">1</span>)</span>:</span></span></code><code><span class="code-snippet_outer">        self.val = val</span></code><code><span class="code-snippet_outer">        self.sum += val * n</span></code><code><span class="code-snippet_outer">        self.count += n</span></code><code><span class="code-snippet_outer">        self.avg = self.sum / self.count</span></code><code>
</code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">if</span> __name__ == <span class="code-snippet__string">"__main__"</span>:</span></code><code>    </code><code><span class="code-snippet_outer">    train_dir_list = <span class="code-snippet__string">'train.txt'</span></span></code><code><span class="code-snippet_outer">    valid_dir_list = <span class="code-snippet__string">'val.txt'</span></span></code><code><span class="code-snippet_outer">    batch_size = <span class="code-snippet__number">64</span></span></code><code><span class="code-snippet_outer">    epochs = <span class="code-snippet__number">80</span></span></code><code><span class="code-snippet_outer">    num_classes = <span class="code-snippet__number">214</span></span></code><code><span class="code-snippet_outer">    train_data = Garbage_Loader(train_dir_list, train_flag=<span class="code-snippet__keyword">True</span>)</span></code><code><span class="code-snippet_outer">    valid_data = Garbage_Loader(valid_dir_list, train_flag=<span class="code-snippet__keyword">False</span>)</span></code><code><span class="code-snippet_outer">    train_loader = DataLoader(dataset=train_data, num_workers=<span class="code-snippet__number">8</span>, pin_memory=<span class="code-snippet__keyword">True</span>, batch_size=batch_size, shuffle=<span class="code-snippet__keyword">True</span>)</span></code><code><span class="code-snippet_outer">    valid_loader = DataLoader(dataset=valid_data, num_workers=<span class="code-snippet__number">8</span>, pin_memory=<span class="code-snippet__keyword">True</span>, batch_size=batch_size)</span></code><code><span class="code-snippet_outer">    train_data_size = len(train_data)</span></code><code><span class="code-snippet_outer">    print(<span class="code-snippet__string">'训练集数量：%d'</span> % train_data_size)</span></code><code><span class="code-snippet_outer">    valid_data_size = len(valid_data)</span></code><code><span class="code-snippet_outer">    print(<span class="code-snippet__string">'验证集数量：%d'</span> % valid_data_size)</span></code><code>    </code><code><span class="code-snippet_outer">    model = models.resnet50(pretrained=<span class="code-snippet__keyword">True</span>)</span></code><code><span class="code-snippet_outer">    fc_inputs = model.fc.in_features</span></code><code><span class="code-snippet_outer">    model.fc = nn.Linear(fc_inputs, num_classes)</span></code><code><span class="code-snippet_outer">    model = model.cuda()</span></code><code>    </code><code><span class="code-snippet_outer">    lr_init = <span class="code-snippet__number">0.0001</span></span></code><code><span class="code-snippet_outer">    lr_stepsize = <span class="code-snippet__number">20</span></span></code><code><span class="code-snippet_outer">    weight_decay = <span class="code-snippet__number">0.001</span></span></code><code><span class="code-snippet_outer">    criterion = nn.CrossEntropyLoss().cuda()</span></code><code><span class="code-snippet_outer">    optimizer = optim.Adam(model.parameters(), lr=lr_init, weight_decay=weight_decay)</span></code><code><span class="code-snippet_outer">    scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=lr_stepsize, gamma=<span class="code-snippet__number">0.1</span>)</span></code><code>    </code><code><span class="code-snippet_outer">    writer = SummaryWriter(<span class="code-snippet__string">'runs/resnet50'</span>)</span></code><code>    </code><code><span class="code-snippet_outer">    best_prec1 = <span class="code-snippet__number">0</span></span></code><code><span class="code-snippet_outer">    <span class="code-snippet__keyword">for</span> epoch <span class="code-snippet__keyword">in</span> range(epochs):</span></code><code><span class="code-snippet_outer">        scheduler.step()</span></code><code><span class="code-snippet_outer">        train(train_loader, model, criterion, optimizer, epoch, writer)</span></code><code>        </code><code><span class="code-snippet_outer">        valid_prec1, valid_prec5 = validate(valid_loader, model, criterion, epoch, writer, phase=<span class="code-snippet__string">"VAL"</span>)</span></code><code><span class="code-snippet_outer">        is_best = valid_prec1 &gt; best_prec1</span></code><code><span class="code-snippet_outer">        best_prec1 = max(valid_prec1, best_prec1)</span></code><code><span class="code-snippet_outer">        save_checkpoint({</span></code><code><span class="code-snippet_outer">            <span class="code-snippet__string">'epoch'</span>: epoch + <span class="code-snippet__number">1</span>,</span></code><code><span class="code-snippet_outer">            <span class="code-snippet__string">'arch'</span>: <span class="code-snippet__string">'resnet50'</span>,</span></code><code><span class="code-snippet_outer">            <span class="code-snippet__string">'state_dict'</span>: model.state_dict(),</span></code><code><span class="code-snippet_outer">            <span class="code-snippet__string">'best_prec1'</span>: best_prec1,</span></code><code><span class="code-snippet_outer">            <span class="code-snippet__string">'optimizer'</span> : optimizer.state_dict(),</span></code><code><span class="code-snippet_outer">            }, is_best,</span></code><code><span class="code-snippet_outer">            filename=<span class="code-snippet__string">'checkpoint_resnet50.pth.tar'</span>)</span></code><code><span class="code-snippet_outer">    writer.close()</span>

from dataset import Garbage_Loader</code><code>from torch.utils.data import DataLoader</code><code>from torchvision import models</code><code>import torch.nn as nn</code><code>import torch.optim as optim</code><code>import torch</code><code>import time</code><code>import os</code><code>import shutil</code><code>os.environ["CUDA_VISIBLE_DEVICES"] = "0"</code><code>

</code><code>"""</code><code> Author : Jack Cui</code><code> Wechat : https://mp.weixin.qq.com/s/OCWwRVDFNslIuKyiCVUoTA</code><code>"""</code><code>

</code><code>from tensorboardX import SummaryWriter</code><code>

</code><code> _, pred = output.topk(maxk, 1, True, True)</code><code> pred = pred.t()</code><code> correct = pred.eq(target.view(1, -1).expand_as(pred))</code><code>

</code><code> class_to = pred[0].cpu().numpy()</code><code>

</code><code> res = []</code><code> for k in topk:</code><code> correct_k = correct[:k].view(-1).float().sum(0, keepdim=True)</code><code> res.append(correct_k.mul_(100.0 / batch_size))</code><code> return res, class_to</code><code>

</code><code>def train(train_loader, model, criterion, optimizer, epoch, writer):</code><code> """</code><code> 训练代码</code><code> 参数：</code><code> train_loader - 训练集的 DataLoader</code><code> model - 模型</code><code> criterion - 损失函数</code><code> optimizer - 优化器</code><code> epoch - 进行第几个 epoch</code><code> writer - 用于写 tensorboardX </code><code> """</code><code> batch_time = AverageMeter()</code><code> data_time = AverageMeter()</code><code> losses = AverageMeter()</code><code> top1 = AverageMeter()</code><code> top5 = AverageMeter()</code><code>

</code><code> </code><code> model.train()</code><code>

</code><code> end = time.time()</code><code> for i, (input, target) in enumerate(train_loader):</code><code> </code><code> data_time.update(time.time() - end)</code><code>

</code><code> input = input.cuda()</code><code> target = target.cuda()</code><code>

</code><code> </code><code> output = model(input)</code><code> loss = criterion(output, target)</code><code>

</code><code> </code><code> [prec1, prec5], class_to = accuracy(output, target, topk=(1, 5))</code><code> losses.update(loss.item(), input.size(0))</code><code> top1.update(prec1[0], input.size(0))</code><code> top5.update(prec5[0], input.size(0))</code><code>

</code><code> </code><code> optimizer.zero_grad()</code><code> loss.backward()</code><code> optimizer.step()</code><code>

</code><code> </code><code> batch_time.update(time.time() - end)</code><code> end = time.time()</code><code>

</code><code> if i % 10 == 0:</code><code> print('Epoch: [{0}][{1}/{2}]\t'</code><code> 'Time {batch_time.val:.3f} ({batch_time.avg:.3f})\t'</code><code> 'Data {data_time.val:.3f} ({data_time.avg:.3f})\t'</code><code> 'Loss {loss.val:.4f} ({loss.avg:.4f})\t'</code><code> 'Prec@1 {top1.val:.3f} ({top1.avg:.3f})\t'</code><code> 'Prec@5 {top5.val:.3f} ({top5.avg:.3f})'.format(</code><code> epoch, i, len(train_loader), batch_time=batch_time,</code><code> data_time=data_time, loss=losses, top1=top1, top5=top5))</code><code> writer.add_scalar('loss/train_loss', losses.val, global_step=epoch)</code><code>

</code><code> </code><code> model.eval()</code><code>

</code><code> with torch.no_grad():</code><code> end = time.time()</code><code> for i, (input, target) in enumerate(val_loader):</code><code> input = input.cuda()</code><code> target = target.cuda()</code><code> </code><code> output = model(input)</code><code> loss = criterion(output, target)</code><code>

</code><code> </code><code> batch_time.update(time.time() - end)</code><code> end = time.time()</code><code>

</code><code> if i % 10 == 0:</code><code> print('Test-{0}: [{1}/{2}]\t'</code><code> 'Time {batch_time.val:.3f} ({batch_time.avg:.3f})\t'</code><code> 'Loss {loss.val:.4f} ({loss.avg:.4f})\t'</code><code> 'Prec@1 {top1.val:.3f} ({top1.avg:.3f})\t'</code><code> 'Prec@5 {top5.val:.3f} ({top5.avg:.3f})'.format(</code><code> phase, i, len(val_loader),</code><code> batch_time=batch_time,</code><code> loss=losses,</code><code> top1=top1, top5=top5))</code><code>

</code><code> print(' * {} Prec@1 {top1.avg:.3f} Prec@5 {top5.avg:.3f}'</code><code> .format(phase, top1=top1, top5=top5))</code><code> writer.add_scalar('loss/valid_loss', losses.val, global_step=epoch)</code><code> return top1.avg, top5.avg</code><code>

</code><code>class AverageMeter(object):</code><code> """Computes and stores the average and current value"""</code><code> def __init__(self):</code><code> self.reset()</code><code>

</code><code> def update(self, val, n=1):</code><code> self.val = val</code><code> self.sum += val * n</code><code> self.count += n</code><code> self.avg = self.sum / self.count</code><code>

</code><code>if __name__ == "__main__":</code><code> </code><code> train_dir_list = 'train.txt'</code><code> valid_dir_list = 'val.txt'</code><code> batch_size = 64</code><code> epochs = 80</code><code> num_classes = 214</code><code> train_data = Garbage_Loader(train_dir_list, train_flag=True)</code><code> valid_data = Garbage_Loader(valid_dir_list, train_flag=False)</code><code> train_loader = DataLoader(dataset=train_data, num_workers=8, pin_memory=True, batch_size=batch_size, shuffle=True)</code><code> valid_loader = DataLoader(dataset=valid_data, num_workers=8, pin_memory=True, batch_size=batch_size)</code><code> train_data_size = len(train_data)</code><code> print('训练集数量：%d' % train_data_size)</code><code> valid_data_size = len(valid_data)</code><code> print('验证集数量：%d' % valid_data_size)</code><code> </code><code> model = models.resnet50(pretrained=True)</code><code> fc_inputs = model.fc.in_features</code><code> model.fc = nn.Linear(fc_inputs, num_classes)</code><code> model = model.cuda()</code><code> </code><code> lr_init = 0.0001</code><code> lr_stepsize = 20</code><code> weight_decay = 0.001</code><code> criterion = nn.CrossEntropyLoss().cuda()</code><code> optimizer = optim.Adam(model.parameters(), lr=lr_init, weight_decay=weight_decay)</code><code> scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=lr_stepsize, gamma=0.1)</code><code> </code><code> writer = SummaryWriter('runs/resnet50')</code><code> </code><code> best_prec1 = 0</code><code> for epoch in range(epochs):</code><code> scheduler.step()</code><code> train(train_loader, model, criterion, optimizer, epoch, writer)</code><code> </code><code> valid_prec1, valid_prec5 = validate(valid_loader, model, criterion, epoch, writer, phase="VAL")</code><code> is_best = valid_prec1 > best_prec1</code><code> best_prec1 = max(valid_prec1, best_prec1)</code><code> save_checkpoint({</code><code> 'epoch': epoch + 1,</code><code> 'arch': 'resnet50',</code><code> 'state_dict': model.state_dict(),</code><code> 'best_prec1': best_prec1,</code><code> 'optimizer' : optimizer.state_dict(),</code><code> }, is_best,</code><code> filename='checkpoint_resnet50.pth.tar')</code><code> writer.close()

代码并不复杂，网络结构直接使 torchvision 的 ResNet50 模型，并且采用 ResNet50 的预训练模型。算法采用交叉熵损失函数，优化器选择 Adam，并采用 StepLR 进行学习率衰减。

保存模型的策略是选择在验证集准确率最高的模型。

batch size 设为 64，GPU 显存大约占 8G，显存不够的，可以调整 batch size 大小。

模型训练完成，就可以写测试代码了，看下效果吧！

创建 infer.py 文件，编写如下代码：

<span class="code-snippet_outer"><span class="code-snippet__keyword">from</span> dataset <span class="code-snippet__keyword">import</span> Garbage_Loader</span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">from</span> torch.utils.data <span class="code-snippet__keyword">import</span> DataLoader</span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">import</span> torchvision.transforms <span class="code-snippet__keyword">as</span> transforms </span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">from</span> torchvision <span class="code-snippet__keyword">import</span> models</span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">import</span> torch.nn <span class="code-snippet__keyword">as</span> nn</span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">import</span> torch</span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">import</span> os</span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">import</span> numpy <span class="code-snippet__keyword">as</span> np</span></code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">import</span> matplotlib.pyplot <span class="code-snippet__keyword">as</span> plt</span></code><code></code><code><span class="code-snippet_outer">os.environ[<span class="code-snippet__string">"CUDA_VISIBLE_DEVICES"</span>] = <span class="code-snippet__string">"0"</span></span></code><code>
</code><code><span class="code-snippet_outer"><span class="code-snippet__function"><span class="code-snippet__keyword">def</span> <span class="code-snippet__title">softmax</span><span class="code-snippet__params">(x)</span>:</span></span></code><code><span class="code-snippet_outer">    exp_x = np.exp(x)</span></code><code><span class="code-snippet_outer">    softmax_x = exp_x / np.sum(exp_x, <span class="code-snippet__number">0</span>)</span></code><code><span class="code-snippet_outer">    <span class="code-snippet__keyword">return</span> softmax_x</span></code><code>    </code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">with</span> open(<span class="code-snippet__string">'dir_label.txt'</span>, <span class="code-snippet__string">'r'</span>, encoding=<span class="code-snippet__string">'utf-8'</span>) <span class="code-snippet__keyword">as</span> f:</span></code><code><span class="code-snippet_outer">    labels = f.readlines()</span></code><code><span class="code-snippet_outer">    labels = list(map(<span class="code-snippet__keyword">lambda</span> x:x.strip().split(<span class="code-snippet__string">'\t'</span>), labels))</span></code><code>    </code><code><span class="code-snippet_outer"><span class="code-snippet__keyword">if</span> __name__ == <span class="code-snippet__string">"__main__"</span>:</span></code><code><span class="code-snippet_outer">    test_list = <span class="code-snippet__string">'test.txt'</span></span></code><code><span class="code-snippet_outer">    test_data = Garbage_Loader(test_list, train_flag=<span class="code-snippet__keyword">False</span>)</span></code><code><span class="code-snippet_outer">    test_loader = DataLoader(dataset=test_data, num_workers=<span class="code-snippet__number">1</span>, pin_memory=<span class="code-snippet__keyword">True</span>, batch_size=<span class="code-snippet__number">1</span>)</span></code><code><span class="code-snippet_outer">    model = models.resnet50(pretrained=<span class="code-snippet__keyword">False</span>)</span></code><code><span class="code-snippet_outer">    fc_inputs = model.fc.in_features</span></code><code><span class="code-snippet_outer">    model.fc = nn.Linear(fc_inputs, <span class="code-snippet__number">214</span>)</span></code><code><span class="code-snippet_outer">    model = model.cuda()</span></code><code>    </code><code><span class="code-snippet_outer">    checkpoint = torch.load(<span class="code-snippet__string">'model_best_checkpoint_resnet50.pth.tar'</span>)</span></code><code><span class="code-snippet_outer">    model.load_state_dict(checkpoint[<span class="code-snippet__string">'state_dict'</span>])</span></code><code><span class="code-snippet_outer">    model.eval()</span></code><code><span class="code-snippet_outer">    <span class="code-snippet__keyword">for</span> i, (image, label) <span class="code-snippet__keyword">in</span> enumerate(test_loader):</span></code><code><span class="code-snippet_outer">        src = image.numpy()</span></code><code><span class="code-snippet_outer">        src = src.reshape(<span class="code-snippet__number">3</span>, <span class="code-snippet__number">224</span>, <span class="code-snippet__number">224</span>)</span></code><code><span class="code-snippet_outer">        src = np.transpose(src, (<span class="code-snippet__number">1</span>, <span class="code-snippet__number">2</span>, <span class="code-snippet__number">0</span>))</span></code><code><span class="code-snippet_outer">        image = image.cuda() </span></code><code><span class="code-snippet_outer">        label = label.cuda() </span></code><code><span class="code-snippet_outer">        pred = model(image)</span></code><code><span class="code-snippet_outer">        pred = pred.data.cpu().numpy()[<span class="code-snippet__number">0</span>]</span></code><code><span class="code-snippet_outer">        score = softmax(pred)</span></code><code><span class="code-snippet_outer">        pred_id = np.argmax(score)</span></code><code><span class="code-snippet_outer">        plt.imshow(src)</span></code><code><span class="code-snippet_outer">        print(<span class="code-snippet__string">'预测结果：'</span>, labels[pred_id][<span class="code-snippet__number">0</span>])</span></code><code><span class="code-snippet_outer">        plt.show()</span>

from dataset import Garbage_Loader</code><code>from torch.utils.data import DataLoader</code><code>import torchvision.transforms as transforms </code><code>from torchvision import models</code><code>import torch.nn as nn</code><code>import torch</code><code>import os</code><code>import numpy as np</code><code>import matplotlib.pyplot as plt</code><code></code><code>os.environ["CUDA_VISIBLE_DEVICES"] = "0"</code><code>

</code><code>def softmax(x):</code><code> exp_x = np.exp(x)</code><code> softmax_x = exp_x / np.sum(exp_x, 0)</code><code> return softmax_x</code><code> </code><code>with open('dir_label.txt', 'r', encoding='utf-8') as f:</code><code> labels = f.readlines()</code><code> labels = list(map(lambda x:x.strip().split('\t'), labels))</code><code> </code><code>if __name__ == "__main__":</code><code> test_list = 'test.txt'</code><code> test_data = Garbage_Loader(test_list, train_flag=False)</code><code> test_loader = DataLoader(dataset=test_data, num_workers=1, pin_memory=True, batch_size=1)</code><code> model = models.resnet50(pretrained=False)</code><code> fc_inputs = model.fc.in_features</code><code> model.fc = nn.Linear(fc_inputs, 214)</code><code> model = model.cuda()</code><code> </code><code> checkpoint = torch.load('model_best_checkpoint_resnet50.pth.tar')</code><code> model.load_state_dict(checkpoint['state_dict'])</code><code> model.eval()</code><code> for i, (image, label) in enumerate(test_loader):</code><code> src = image.numpy()</code><code> src = src.reshape(3, 224, 224)</code><code> src = np.transpose(src, (1, 2, 0))</code><code> image = image.cuda() </code><code> label = label.cuda() </code><code> pred = model(image)</code><code> pred = pred.data.cpu().numpy()[0]</code><code> score = softmax(pred)</code><code> pred_id = np.argmax(score)</code><code> plt.imshow(src)</code><code> print('预测结果：', labels[pred_id][0])</code><code> plt.show()

这里需要注意的是，DataLoader 读取的数据需要进行通道转换，才能显示。

预测结果：