1作者: saptakbhoumik311 天前原帖
免责声明:英语不是我的母语。我使用了大型语言模型来帮助我清晰地撰写这篇帖子。 大家好, 我想分享一下我的项目,并希望能得到一些反馈。 目标:目前大多数图像模型体积庞大,对于基本任务来说显得过于复杂。这个项目探讨了我们可以将图像分类模型缩小到多小,同时仍保持其功能,通过将其简化到最低限度。 当前进展与结果: 猫狗分类:这是我完成的第一个任务,使用了一个包含25,000张图像的数据集,采用了滤波器组预处理和紧凑型卷积神经网络(CNN)。 在参数少于12,500的模型中,测试准确率达到了86.87%。 多个参数少于5,000的模型达到了超过83%的准确率,展示了良好的效率与性能之间的权衡。 CIFAR-10分类:这是我完成的第二个任务,使用了CIFAR-10数据集。该方法仅依赖于紧凑型CNN架构,没有使用滤波器组预处理。 一个参数为22,110的模型达到了87.38%的准确率。 一个参数为31,150的模型达到了88.43%的准确率。 所有代码和实验都可以在我的GitHub仓库中找到: [https://github.com/SaptakBhoumik/TinyVision](https://github.com/SaptakBhoumik/TinyVision) 我非常希望你们能查看这个项目,并告诉我你们的反馈! 如果你觉得这个项目有趣,也请给我一个星标!