水稻病害图像自动识别中数据集的构建
【摘要】:利用图像识别技术开发手机软件来实现对水稻病害图像的自动鉴别,可为水稻种植户提供便利,降低成本。本研究以稻瘟病为例,利用深度学习对自行拍摄构建的田间稻瘟病及健康水稻叶片图像数据集进行二分类训练及测试,探究不同数量的水稻病害图像对卷积神经网络模型精度的影响,寻找能够满足二分类训练要求所需的水稻病害图像数量。分别建立单类含50,100,300,500,1 000,1 500,2 000,3 000幅图片的数据集并按照8:2的比例分为训练集及验证集,利用卷积神经网络模型VGG16分别对各数据集进行三次重复训练,并使用300张图片对得到的不同模型进行测试,统计测试结果。最后用数学模型对训练得到的损失率及准确度进行拟合,并使用单类为2 500的数据集训练及测试结果对拟合模型进行测试。训练及测试结果表明,随着单类水稻病害图片数量的上升,损失率有逐渐下降的趋势,准确率则在逐渐上升且上升趋势逐渐平缓。利用多重比较的方法对不同数量等级的模型训练准确率进行比较发现,当单类数量从500增加到1 000,模型的准确率会有显著提升,但是单类图片数从1 000~3 000的模型准确率无显著变化。结果表明水稻病害图像的数量上升可提高模型训练效果,但超过一定数量,训练时间会大幅度增加,模型准确率却不会显著上升。