当前位置:网站首页 > R语言数据分析 > 正文

resnet18比resnet50好(resnet18和resnet50区别)



了解ResNet18的网络结构;掌握模型的保存和加载方法;掌握批量测试图片的方法。

结合图像分类任务,使用典型的图像分类网络ResNet18,实现手写数字识别。

ResNet作为经典的图像分类网络有其明显的优点:

  • 首先,它足够深,常见的有34层,50层,101层。通常层次越深,表征能力越强,分类准确率越高。
  • 其次,可学习,采用了残差结构,通过shortcut连接把低层直接跟高层相连,解决了反向传播过程中因为网络太深造成的梯度消失问题。
  • 此外,ResNet网络的性能很好,既表现为识别的准确率,也包括它本身模型的大小和参数量。

1. 加载并处理数据集

训练集规模:60000,测试集规模:10000

2. 下载构建好的resnet18网络源码文件

为了让开发者更好地体验MindSpore框架优势,MindSpore Model Zoo已经添加了更多典型网络和相关预训练模型,涉及到计算机视觉、自然语言处理、推荐系统、图神经网络等领域。其中的ResNet系列网络模型也已经使用MindSpore实现。

2.1. 下载网络源码文件

采用ResNet-18 实现手写数字识别任务,需要将下载下来,才可以使用MindSpore定义好的网络结构。

2.2.修改网络文件中通道数

由于使用的是单通道的灰度图像数据,这里需要将原网络结果中的第一层卷积层的输入通道 3改为1,即将中的第387行的 3 改为 1 即可,这里使用linux中的sed命令来编辑文本。

3. 载入resnet18网络

4. 定义损失函数和优化器

5. 配置运行信息

6. 调用Model高阶API进行训练和保存模型文件

        模型训练包含两层迭代,数据集的多轮迭代(epoch)和一轮数据集内按分组(batch)大小进行的单步迭代。

为了简化训练过程,MindSpore封装了Model高阶接口:

  • 用户输入网络、损失函数和优化器完成Model的初始化;
  • 调用train接口进行训练,train接口参数包括迭代次数(epoch)和数据集(dataset);
  • 调用Model的eval接口预测新图像类别;
  • 模型保存是对训练参数进行持久化的过程。Model类中通过回调函数(callback)的方式进行模型保存。

这里对数据进行一轮迭代,训练耗时约30秒

epoch: 1 step: 937, loss is 0.0 result: {'acc': 0.97436} 训练总耗时: 16.7 s

        从上面的输出结果,可以看到ResNet18模型仅训练一个epoch,耗时仅17秒左右,就在手写数字识别任务的测试集上达到了0.98以上的准确率。该准确率可以达到应用水平,下面将保存模型、并加载模型进行批量图片预测,看看真实的预测效果如何。

查询训练过程中,保存好的模型

https://blog.51cto.com/u_/models/ckpt/ ├── train_resnet_mnist-1_937.ckpt └── train_resnet_mnist-graph.meta 0 directories, 2 files

        每937个step保存一次模型权重参数.ckpt文件,一共保存了1个,另外.meta文件保存模型的计算图信息。

7. 批量图片的预测显示

预测值 -- > [0 3 8 5 2 0 1 2 8 5 0 3 4 5 4 5 6 2 9 4 8 0 1 1 7 5 6 7 8 5 9 4] 真实值 -- > [0 3 1 5 2 0 1 2 8 5 0 3 4 5 4 5 6 2 4 4 8 0 1 1 7 5 6 7 8 5 9 4]

resnet50对比shuffnetv2的缺点 resnet50和resnet18优缺点_迭代

        从预测结果可以看出,32张图片只有一张错误预测:1预测成了8,说明模型的预测效果还是不错的。

到此这篇resnet18比resnet50好(resnet18和resnet50区别)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • kubesphere怎么读(kubeadm怎么读)2026-05-09 09:54:04
  • 字符串转interger(字符串转integer类型)2026-05-09 09:54:04
  • arcpy模块(arcpy包)2026-05-09 09:54:04
  • 启动docker服务的命令(dockerd启动)2026-05-09 09:54:04
  • crrna是什么(crRNa是什么)2026-05-09 09:54:04
  • xpac客服(xprinter客服)2026-05-09 09:54:04
  • hrnet group中国(hrnet group中国官网)2026-05-09 09:54:04
  • 将网页文字复制到word(将网页文字复制到wps时为什么长段复制就漏字)2026-05-09 09:54:04
  • ewm系统与erp的区别(erp和erm有什么区别)2026-05-09 09:54:04
  • docker最新版本是多少(docker版本号有哪些)2026-05-09 09:54:04
  • 全屏图片