待做
- 了解项目工作原理
已做
- 运行下载项目,进行可行性测试
- 训练测试,在迭代1800次后趋于稳定。
- 测试集测试无差错。
- GitHub项目下载
- pycharm-tensorflow-gpu环境配置
- 下载猫图集
- 老鼠图集爬取
- 爬虫软件https://github.com/sczhengyabin/Image-Downloader
- 人工筛选图集 (由于是从百度和bing爬取,会掺有其他图片,需要先进行人工筛选)
- 爬虫图集中格式转换,由于爬取图片为png,gif,jpg等不同格式,为了统一为jpg格式 需要使用ps进行批量图片转换处理。
- 使用Image-Downloader和Fatkun插件爬取各种鼠类图片,由于网络上大部分鼠类图片都是仓鼠,因此训练集中仓鼠也占大部分。
- 使用everthing对图片进行批量重命名
数据说明
老鼠图集:共1063张,使用1000张作为训练,剩余图像用于测试。
猫图集:共12500张,使用欠采样,减少猫图集数量至1000,使得正负样本比例均衡。
环境介绍
硬件
- CPU:i5-9400h
- GPU:GTX1650-4g
- RAM:16G-DDR4
软件环境
- Python 3.7.3
- tensorflow-gpu 2.4.0
- numpy 1.19.5
- CUDA 11.7.57
- PyCharm
算法说明
Q.E.D.