农业大数据学报 ›› 2023, Vol. 5 ›› Issue (4): 47-55.doi: 10.19788/j.issn.2096-6369.230405
赵鸿鑫1,2(), 邵明月1,2, 潘攀1,2, 王芝奥1,2, 牟强1,2, 贺子康1,2, 张建华1,2,*(
)
ZHAO HongXin1,2(), SHAO MingYue1,2, PAN Pan1,2, WANG ZhiAo1,2, MU Qiang1,2, HE ZiKang1,2, ZHANG JianHua1,2,*(
)
摘要:
深度神经网络是棉花病害智能识别的一种重要方法。覆盖更多病害、土壤和环境信息的科学数据既是此类方法发展的基础,也是当前的关键制约因素之一。本文提出的棉花病害数据采集自中国海南省三亚市坡田洋高标准农田示范基地中的棉花种植田块,覆盖了炭疽病、细菌性角斑病、褐斑病和枯萎病四种常见棉花病害,包括3453张高分辨率的健康叶片和不同生长阶段的病叶图像。所有样品获取均采用田间随机采样方式,经筛选后由10名棉花病理学专家进行鉴定与标注,同时另选20名标注者对标注后图像进行随机重复标注以检测质量,Vision Transformer模型被引入以进一步验证数据集的稳定性。相对于其他同类数据集,当前数据集数据采集于复杂的田间环境,覆盖了常见棉花病害且具有高分辨率,可更好地服务于棉花病害智能识别模型、算法的研究、训练与验证。
数据摘要:
项目 | 描述 |
---|---|
数据库(集)名称 | 一种面向深度神经网络模型的棉花常见病害训练数据集 |
所属学科 | 农业科学、计算机科学 |
数据时间范围 | 2021年12月-2023年8月 |
数据地理空间覆盖 | 海南省三亚市坡田洋基地平原种植区域,中心经纬度为(109.165497,18.3931609999999) |
数据类型与技术格式 | 棉花图像,*.png;棉花病害分类标准,*.TXT |
数据库(集)组成 | 数据集由3453个图像文件和一个文本类型文件构成,图像文件归属文件夹命名为棉花病害数据,其中的文件均为*.png文件。文本文件归属文件夹命名为棉花病害数据集,其中文件均为*.TXT。 |
数据量 | 2.74 GB |
数据可用性 | CSTR:17058.11.sciencedb.agriculture.00029 DOI:10.57760/sciencedb.agriculture.00029 |
基金项目 | 国家自然科学基金(31971792, 32160421);国家重点研发计划(2022YFF0711805);三亚崖州湾科技城科技专项资助(SCKJ-JYRC-2023-45);中国农业科学院创新工程(CAAS-ASTIP-2023-AII, ZDXM23011);中央级公益性科研院所基本科研业务费专项(Y2022XK24,Y2022QC17, JBYW-AII-2022-14, JBYW-AII-2023-06);三亚中国农业科学院国家南繁研究院南繁专项(YDLH01, YDLH07, YBXM10, ZDXM23011, YBXM2312) |