农业大数据学报 ›› 2025, Vol. 7 ›› Issue (2): 261-268.doi: 10.19788/j.issn.2096-6369.100042
GAO ZhuoJun1(), ZHANG DanDan2,*(
), CHEN RongYu3
摘要:
结合广东省农作物审定品种数据和知识图谱相关技术开展研究。种业是农业产业链的起始环节,是保障国家粮食安全和经济发展的重要支柱,审定品种作为该环节的重要创新资源,经由严格测试和客观评价后予以推广,有效实现种质资源的保护和利用,推动种业高质量发展。随着农业信息化的推进,农业数据量剧增,大数据、人工智能等现代信息技术对提高农业生产效率和优化资源配置带来了突出作用。知识图谱作为人工智能和语义网络的重要分支技术,已广泛应用于各大领域,而农业领域的知识图谱研究,相对侧重作物栽培、水肥管理、病虫害防治等重点问题。本研究基于数据可靠性、实用性、连续性等因素,通过获取广东省农业农村厅公开发布信息,采集了2016—2023年共计8年的广东省农作物审定品种数据作为基础数据,该数据以.doc格式存储,包含大量文字和字符。为便于机器识别及后续知识图谱构建,本研究通过数据清洗去除噪声影响,根据品种特征特性和产量表现提取共性属性,最终整理合并了水稻、玉米、大豆三类农作物审定品种共计823条种质资源数据,并以.xlsx和.json两种格式存储为结构化数据。为验证数据有效性,本研究采用Neo4j图形数据库成功构建了广东省主要农作物审定品种知识图谱。相关科研和生产单位可基于本数据集建立农作物审定品种专家知识库,并通过数据库扩充、多源数据融合等操作,构建面向具体农业任务的智能问答、管理决策、信息推荐等智慧服务。
数据摘要:
项目 | 描述 |
---|---|
数据集名称 | 2016—2023年广东省主要农作物审定品种知识图谱构建数据集 |
所属学科 | 农学其他学科(21099) |
研究主题 | 农作物;农业知识图谱;数据挖掘 |
数据时间范围 | 2016—2023年 |
时间分辨率 | 年 |
数据地理空间覆盖 | 广东省 |
数据类型与技术格式 | .xlsx,.json |
数据库(集)组成 | 1个表格文件和3个文本文件。表格文件包含2016-2023年广东省三类农作物(水稻、玉米、大豆)审定品种共823条种质资源数据;文本文件为水稻、玉米、大豆根据其特征特性和产量表现提取的共性高频属性数据。 |
数据量 | 4.18 MB |
主要数据指标 | 作物类别、品种名称、品种来源、生育期、种植时间、形态特征、抗病性、产量表现、平均亩产、种植地区等 |
数据可用性 | CSTR: 17058.11.sciencedb.agriculture.00117; https://cstr.cn/17058.11.sciencedb.agriculture.00117 DOI: 10.57760/sciencedb.agriculture.00117; |
经费支持 | 广东省岭南特色农业科学数据中心(2021B1212100005);作物种业数据资源知识融合与共享服务研究(2023KMKS04) |