农业大数据学报

迈向数智农业：场景、数据与智能

周国民

2025, 7(2): 141-143. DOI: 10.19788/j.issn.2096-6369.200007

摘要 ( 80 )

HTML ( 17)

PDF (228KB) ( 61 )

参考文献 | 相关文章 | 计量指标

AI知识蒸馏技术演进与应用综述

毛克彪, 代旺, 郭中华, 孙学宏, 肖柳瑞

2025, 7(2): 144-154. DOI: 10.19788/j.issn.2096-6369.000106

摘要 ( 129 )

HTML ( 13)

PDF (1491KB) ( 411 )

数据和表 | 参考文献 | 相关文章 | 计量指标

人工智能（AI）中知识蒸馏（KD）技术通过构建师生框架实现模型轻量化，成为解决深度学习性能与效率瓶颈的关键技术。本文从算法原理演进的视角，系统解析知识蒸馏的理论框架，将知识迁移路径归纳为基于响应、特征、关系及结构四类范式，并构建动态与静态知识蒸馏方法的对比评估体系。我们深入探讨了跨模态特征对齐、自适应蒸馏架构及多教师协同验证等创新机制，同时剖析渐进式知识迁移与对抗蒸馏等融合策略。通过计算机视觉与自然语言处理领域的实证分析，评估了该技术在图像分类、语义分割及文本生成等场景中的实用性。特别地，我们强调了知识蒸馏在农业与地学领域的潜力，例如在资源受限环境下的精准农业和地理空间分析中实现高效部署。研究发现当前模型普遍存在知识选择机制模糊、理论解释性不足等瓶颈问题。据此，我们探讨了自动化蒸馏系统与多模态知识融合等前沿方向的可行性，为边缘智能部署及隐私计算提供了新的技术路径，尤其适用于农业智能化与地学研究。

推动现代农业转型：智慧农业发展的思考与展望

孔繁涛, 赵仁杰, 张鑫蕊, 刘振虎, 曹姗姗

2025, 7(2): 155-160. DOI: 10.19788/j.issn.2096-6369.000090

摘要 ( 112 )

HTML ( 10)

PDF (397KB) ( 149 )

数据和表 | 参考文献 | 相关文章 | 计量指标

随着信息技术的快速发展，智慧农业作为现代农业的重要发展方向，正逐渐成为推动我国农业转型升级的关键力量。本文通过对国内外智慧农业的研究现状进行综述，探讨了其在我国的具体实践情况和发展趋势。文章指出，智慧农业不仅能够提升农业生产效率和产品质量，还为解决传统农业面临的诸多问题提供了新思路。在技术层面，物联网、大数据、云计算等新兴技术的应用，使得农业生产过程更加智能化和精准化；而在管理方面，则强调通过构建综合服务平台来优化资源配置，提高服务效能。此外，政策支持对于智慧农业的发展至关重要，政府应加大对基础设施建设和人才培养的投入，建立健全相关法律法规体系以保障数据安全。同时，鼓励社会各界积极参与到智慧农业建设中来，形成多方协同的良好局面。最后，本文提出了未来智慧农业需要重点关注的几个方向：一是深化技术研发，二是加强跨领域合作，三是注重实践经验总结与推广。

基于车载相机和HLS时序遥感数据的作物分类研究

钱涛, 詹雅婷, 李胤, 宋珂, 邵明超, 虞钟直, 程涛, 姚霞, 郑恒彪, 朱艳, 曹卫星, 江冲亚

2025, 7(2): 161-172. DOI: 10.19788/j.issn.2096-6369.000098

摘要 ( 73 )

HTML ( 2)

PDF (3682KB) ( 47 )

数据和表 | 参考文献 | 相关文章 | 计量指标

旨在探讨基于车载相机和HLS时序遥感数据相结合的作物分类方法，以提高作物分类的效率和精度，解决传统方法中地面样本采集效率低、遥感物候特征利用不充分等问题。研究以江苏省秋粮分类为例，验证了此方法的可行性和应用潜力。通过车载相机采集道路两侧作物图像并构建大量人工标注样本，结合2023年和2024年的HLS时序数据，采用高斯滤波重构时间连续的地表反射率，提取多维特征，构建随机森林分类模型。研究结果表明，水稻、玉米和大豆在HLS时序数据中表现出较为明显的差异。水稻的分类精度最高，生产者精度与用户精度均超过90%，而玉米和大豆因物候特征的相似性，精度相对较低（74%-85%）。模型在独立验证县的总体分类精度为89%，验证县内的水稻主要分布于全县东南区域，玉米和大豆则集中于西北区域，且分布特征清晰。车载相机结合HLS时序数据可实现高效的作物分类，随机森林模型对高维特征整合与抗样本不平衡性具有显著优势。尽管模型总体表现优良，但在破碎地块和高云量区域仍有改进空间。未来需融合多源遥感数据缓解云干扰，并扩展作物类型以增强模型泛化能力。

一种基于改进YOLO的小目标检测模型

叶端南, 李根田

2025, 7(2): 173-182. DOI: 10.19788/j.issn.2096-6369.000073

摘要 ( 82 )

HTML ( 6)

PDF (2238KB) ( 31 )

数据和表 | 参考文献 | 相关文章 | 计量指标

随着深度学习技术的快速发展，目标检测在多个领域得到广泛应用。然而，小目标检测由于其尺寸小、特征不明显，导致检测性能受限。为了解决这一问题，本文提出了一种基于YOLOv8的改进目标检测模型。该模型集成了幽灵瓶颈网络、多尺度自由注意力模块、改进特征金字塔网络和动态Soft-NMS等优化策略，旨在提升密集小目标的检测精度和模型的计算效率。通过在自制数据集上的实验验证，改进YOLO模型在精度、召回率和mAP@0.5等关键指标上均优于现有主流模型，有效平衡了模型的参数量和浮点计算量。实验结果表明，所提方法在保证检测精度的同时，实现了模型的轻量化，为资源受限的嵌入式设备上的目标检测任务提供了有效的解决方案。

农业科学数据在线分析挖掘平台设计与应用

李佳乐, 林佳, 贺子康, 王健, 张建华, 周国民

2025, 7(2): 183-192. DOI: 10.19788/j.issn.2096-6369.000045

摘要 ( 66 )

HTML ( 3)

PDF (2679KB) ( 29 )

数据和表 | 参考文献 | 相关文章 | 计量指标

随着数据驱动科学研究范式的发展，农业科学数据在科技创新中的作用越来越突出，随之而来的是农业科学数据分析挖掘和应用方法与技术研究也不断发展。围绕农业科学数据分析挖掘存在数据语义孤岛严重，以及数据挖掘工具不全、不配套与场景适应性差等突出问题。本文设计了平台架构，构建了分析挖掘引擎，加载了典型和专业分析挖掘算子工具，形成了农业科学数据在线分析挖掘平台，包括数据层、领域数据分析工具层、自动化挖掘框架层、在线分析引擎，以及用户界面层5个层次，开发了数据管理、组件管理、场景管理、挖掘分析4大功能模块。平台具备应用场景管理、在线分析、自动化挖掘等功能，突破“数据资源—分析工具—应用场景”衔接不畅的问题，形成集数据资源、分析模型、组件工具、场景分析和标准流程于一体的在线分析挖掘应用环境，支撑从“数据聚合—挖掘分析链—在线分析—场景应用”的农业科学数据在线分析挖掘全过程，实现超大规模数据及不同场景分析应用的并发在线交互计算分析。

多学科通用型开放科学数据共享平台对比研究——以Zenodo和ScienceDB为例

贺郝钰, 侯春梅, 孙力炜, 迟秀丽, 叶喜艳

2025, 7(2): 193-200. DOI: 10.19788/j.issn.2096-6369.000063

摘要 ( 77 )

HTML ( 1)

PDF (623KB) ( 173 )

数据和表 | 参考文献 | 相关文章 | 计量指标

通过对两个具有代表性的多学科通用型科学数据共享平台——Zenodo和ScienceDB的比较分析，探讨它们在功能、服务、社区协作等方面的异同，并提出其各自的优势和潜在的改进空间。这一研究的意义在于为科研数据平台的优化和完善提供参考，促进科学数据的高效管理和利用，从而为科学研究的进步做出贡献。研究采用对比分析法，深入探讨了Zenodo和ScienceDB在数据存储、共享机制、用户界面设计、技术支持、社区互动、数据安全与隐私保护等方面的特点和差异。分析过程中，详细对比了两个平台的数据提交与描述、元数据要求、数据服务、数据统计和社区服务等多个方面，以评估它们在科研数据管理领域的服务能力与特色。Zenodo以其友好的用户界面、灵活的技术架构和强大的社区功能在国际上享有盛誉，而ScienceDB则凭借其对FAIR原则的遵循和对数据治理的重视，为中国乃至全球的科研数据共享提供了有力支持。两个平台各有优势，但也存在改进空间。Zenodo可以进一步强化数据的本地化服务，ScienceDB则可以借鉴Zenodo在社区管理的经验，提升用户体验。最终，两个平台的持续发展和优化将共同推动科学研究的进步和知识的传播。

农业科学数据本体网络系统研发

陈晓静, 赵晓燕, 贺子康, 林佳, 李佳乐, 申家炜, 樊景超, 闫燊, 王健, 张建华, 周国民

2025, 7(2): 201-212. DOI: 10.19788/j.issn.2096-6369.000083

摘要 ( 66 )

HTML ( 4)

PDF (4371KB) ( 37 )

数据和表 | 参考文献 | 相关文章 | 计量指标

农业科学数据本体网络的构建是农业科学数据分析挖掘的重要内容。它可以将分散在不同数据库、不同格式的数据进行集成，将不同领域的数据进行关联和整合，形成更全面的数据池，支持跨领域跨学科数据的自动分析挖掘，发现隐藏的知识、模式和趋势。本研究构建了包含农业、作物、基因、序列等相关28个农业科学数据本体的数据库，制定了农业科学数据本体存储标准，搭建了基于HugeGraph图数据库的农业科学数据本体网络，建立“数据集-数据记录-信息实体”映射关系机制，并且设计了农业科学数据本体网络系统技术框架。系统实现了自动化导入、自动管理和本体网络可视化等功能，突破当前农业本体数量多、数据量大、缺少专有系统进行管理等突出问题，研发了集大规模多格式农业科学数据本体导入、本体管理、本体内和跨本体映射关系编辑、本体网络可视化等四大类功能于一体的农业科学数据本体网络系统，有力提升了农业科学数据本体管理能力，支撑海量数据资源高效语义关联发布以及跨领域跨学科的数据自动聚合，为农业科学数据在线分析挖掘奠定了基础。

林业数据分类分级方法研究

薛亚东, 秦琳, 黄宁辉, 孟先进, 张水花

2025, 7(2): 213-219. DOI: 10.19788/j.issn.2096-6369.000091

摘要 ( 56 )

HTML ( 4)

PDF (421KB) ( 59 )

数据和表 | 参考文献 | 相关文章 | 计量指标

随着林业信息化技术的快速发展，林业领域逐渐意识到数据资源的重要性。本研究旨在通过研究分类分级方法对林业数据进行系统化管理。首先，将林业数据依据用途分为林业基础地理数据、林业调查规划数据、林业业务数据和公共数据四大类；其次，根据数据遭到篡改、破坏、泄露或非法获取的潜在危害程度，将其分为1-4级四个安全级别。通过制定林业数据共享服务规范，建立在内网、政务网、互联网三网环境下的数据安全管理体系，实现数据交换、分发及应用的规范化和制度化，从而促进林业数据在业务中的共享服务和协同应用。

作物性状调控基因知识图谱数据集

张丹丹, 赵瑞雪, 宼远涛, 鲜国建

2025, 7(2): 220-226. DOI: 10.19788/j.issn.2096-6369.100051

摘要 ( 69 )

HTML ( 3)

PDF (492KB) ( 94 )

数据和表 | 参考文献 | 相关文章 | 计量指标

当前，作物育种相关的多维度科学数据呈指数级增长，这些半结构化和结构化的科学数据分布在不同领域科学数据库中，缺少跨物种多维度科学数据的关联融合数据集，阻碍了已有作物育种知识的迁移复用与作物育种科学数据价值的最大化发挥，这为作物性状调控基因知识发现带来了挑战。本研究基于数据的可靠性、实用性、易用性等原则，选取PubMed文献数据库与Phytozome、Ensembl plants、UniProt、RGAP、STRING、Pfam、KEGG和GO作为数据获取来源，采用多路径知识抽取的方式对不同数据格式的科学数据分别进行实体及关系的抽取。面向结构化数据的映射知识抽取；面向XML半结构化数据，采用基于Kettle进行数据解析的知识抽取；面向FASTA半结构化数据，采用基于BLAST模型计算的知识抽取。面向Text非结构化数据，采用基于大语言模型的知识抽取。在完成以上实体和关系抽取的基础上，进一步基于实体映射和特定属性关联的方式，实现多源作物育种知识的关联融合。形成了作物性状调控基因知识图谱数据集，并以.csv格式存储为结构化数据。该数据集包含13个实体数据集和14个语义关系数据集。为了验证该数据集的有效性，采用Neo4j图数据库进行数据集存储。最终，形成了涵盖约13万个节点和55万条语义关系的作物性状调控基因知识图谱，可有效支撑跨物种基因知识的关联检索。作物性状调控基因知识图谱数据集已为优异多效基因发现、跨物种基因功能预测与通路基因网络潜在发现等作物育种知识发现提供了关键的语义模型和重要的数据基础。相关科研和生产单位可基于本数据集构建作物性状调控基因知识库，为作物育种知识发现服务平台的构建提供关键的知识资源底座。

数据摘要：

项目	描述
数据集名称	作物性状调控基因知识图谱数据集
所属学科	农学其他学科（21099）
研究主题	作物；性状调控基因知识图谱；数据挖掘
数据类型与技术格式	.csv
数据库（集）组成	27个表格文件，包含水稻、玉米、小麦、拟南芥跨物种关联融合的13个实体数据集与14个语义关系数据集。
数据量	32.18 MB
主要数据指标	转录组名称、功能描述、物理位置、物种等
数据可用性	CSTR: 17058.11.sciencedb.agriculture.00175; https://cstr.cn/17058.11.sciencedb.agriculture.00175 DOI: 10.57760/sciencedb.agriculture.00175; https://doi.org/10.57760/sciencedb.agriculture.00175
经费支持	中国农业科学院科技创新工程（CAAS-ASTIP-2016-AII）

榴莲99份种质资源变异位点数据集

冀晓昊, 郑道君, 谢圣华, 时梦, 钟义旺, 王莹莹, 王孝娣, 刘凤之, 冯学杰, 王海波

2025, 7(2): 227-237. DOI: 10.19788/j.issn.2096-6369.100040

摘要 ( 47 )

HTML ( 0)

PDF (695KB) ( 28 )

数据和表 | 参考文献 | 相关文章 | 计量指标

榴莲具有较高的经济价值和营养价值。我国榴莲高度依赖进口，海南省榴莲产业处于刚刚起步阶段，存在面积少、产量低、品种完全依赖引种而缺乏自主性、配套栽培技术欠缺等诸多问题，导致市场需求大而产业薄弱的矛盾突出，迫切需要进行榴莲种质资源收集、鉴定与评价。该研究对99份榴莲种质资源提取DNA，构建文库并开展了二代全基因组测序，对测序数据开展了质控、变异位点挖掘注释和群体进化等生信分析。测序数据量共计1.62 Tb，共挖掘到54 974 697个变异位点，包括SNP、INS和DEL三种变异类型，以SNP为主，榴莲基因组中平均每13个碱基有1个变异位点，变异位点主要位于基因间，位于基因外显子和内含子的较少。99份榴莲资源可以分成3个亚群，LD系数降低到最大值的一半的衰减距离只有0.1－0.2 kb，表现出丰富的遗传多样性。99份榴莲种质资源的基因组测序数据和变异位点信息，为榴莲遗传学以及育种方法和育种理论研究提供了基础数据支撑，有助于海南乃至世界榴莲品种选育。

数据摘要：

项目	描述
数据库（集）名称	榴莲99份种质资源变异位点数据集
所属学科	农学，生物学
研究主题	榴莲种质资源遗传变异
数据时间范围	2022年-2023年
时间分辨率	1年
数据地理空间覆盖	海南省三亚市
数据类型与技术格式	.XLSX和VCF
数据库（集）组成	本数据集由1个表格和1个VCF文件组成，主要包括WGS测序数据质控结果、比对情况和变异位点信息。
数据量	143.36 GB
数据可用性	CSTR:17058.11.sciencedb.agriculture.00077;https://cstr.cn/17058.11.sciencedb.agriculture.00077 DOI:10.57760/sciencedb.agriculture.00077; https://doi.org/10.57760/sciencedb.agriculture.00077
经费支持	中国农业科学院南繁专项（SWAQ09）；中国农业科学院创新工程项目（CAAS-ASTIP-2021-RIP-02）

188个鲜食葡萄品种果皮中花色苷组分数据集

武亚敬, 冀晓昊, 于祎飞, 时梦, 王宝亮, 王孝娣, 刘凤之, 李明亮, 王贺, 刘俊, 王海波

2025, 7(2): 238-245. DOI: 10.19788/j.issn.2096-6369.100020

摘要 ( 62 )

HTML ( 2)

PDF (2064KB) ( 19 )

数据和表 | 参考文献 | 相关文章 | 计量指标

葡萄果皮色泽从青色到黄色，再到红色、紫色乃至黑色，表现出了丰富的遗传多样性。花色苷的组分和含量是葡萄果皮红色形成的物种基础。采用HPLC和HPLC-MS/MS的方法对188个葡萄品种果皮花色苷进行了定性和定量分析。热图和主成分分析发现不同品种的花色苷组成和含量表现出了丰富的多态性和特异性，花色苷组分含量可以作为葡萄品种鉴定的辅助指标。葡萄品种花色苷总含量与组分个数总体上呈正相关关系，即花色苷的含量越高，组分种类也越多；含量越低，组分种类也越少。芍药素-3-葡萄糖苷、矢车菊素-3-葡萄糖苷、锦葵素-3-葡萄糖苷、飞燕草素-3-葡萄糖苷和矮牵牛素3-葡萄糖苷是葡萄中出现频率和含量较高的几种花色苷组分，非酰基化修饰组分的含量高于酰基化修饰组分的含量，锦葵素的酰基化修饰组分含量要高于其他种类花色素。最高含量花色苷组分共发现7种，其中芍药素-3-葡萄糖苷占比最高，其次是矢车菊素-3-葡萄糖苷和锦葵素-3-葡萄糖苷。花色苷总含量与酰基化组分总含量表现出正相关，但也发现一些不发生酰基化或酰基化程度特别低的品种。本研究提供了188个葡萄品种果皮花色苷组分和含量的翔实数据，为研究葡萄色泽形成机制提供了重要的理论基础和数据支持。

数据摘要：

项目	描述
数据库（集）名称	188个鲜食葡萄品种果皮中花色苷组分数据集
所属学科	农学，生物学
研究主题	葡萄花色苷组分与含量
数据时间范围	2022年—2023年
时间分辨率	1年
数据地理空间覆盖	河北省张家口市怀来县
数据类型与技术格式	.xlsx
数据库（集）组成	本数据集由8个表格数据组成，主要包括188个葡萄品种果皮花色苷高效液相测定结果的组分名称、峰面积和含量。
数据量	186 KB
数据可用性	CSTR:17058.11.sciencedb.agriculture.00042; https://cstr.cn/17058.11.sciencedb.agriculture.00042 DOI:10.57760/sciencedb.agriculture.00042; https://doi.org/10.57760/sciencedb.agriculture.00042
经费支持	国家重点研发计划（2023YFD1200100）；国家农业科技园区专项（2021C-01）；山东省重点研发计划（2022TZXD0010）；中国农业科学院创新工程项目（CAAS-ASTIP-2021-RIP-02）；怀来葡萄与葡萄酒产业科技特派团

贵州喀斯特地区先锋树种火棘叶片功能性状数据集

杜娇艳, 张红玉, 李安定, 曹洋, 蔡国俊

2025, 7(2): 246-245. DOI: 10.19788/j.issn.2096-6369.100047

摘要 ( 69 )

HTML ( 0)

PDF (2794KB) ( 53 )

数据和表 | 参考文献 | 相关文章 | 计量指标

研究植物叶片功能性状对环境变化的响应，有助于揭示植物适应策略，植物叶片功能性状数据库（集）已成为宏观尺度上研究植物适应策略以及宏观生态学研究的重要工具，但在宏观尺度上，仍较缺乏针对某一物种和某一特定生境的植物叶片功能性状数据以供分析研究。我们于2023年7月至8月，采集了广泛分布于贵州省喀斯特地区的先锋树种火棘 (Pyracantha fortuneana)，共计93个样点406株植物的8120个叶片，测定和计算了叶片湿重、叶片干重、叶长、叶宽、叶面积、比叶面积等9个形态性状以及叶片碳、氮、磷含量及其计量比等6个化学性状指标，同时采集了93个采样点的土壤样品，测定了土壤有机碳含量、全氮含量和全磷含量，汇编为“贵州喀斯特地区先锋树种火棘叶片功能性状数据集”，数据集包括：（1）功能性状的说明；（2）采样点地理信息及简要环境描述；（3）8120个叶片的形态性状实测数据；（4）406株火棘的叶片碳、氮、磷化学计量特征；（5）93个采样点的土壤有机碳、全氮、全磷含量数据；（6）8120个叶片的形态性状样点平均值。该数据集可以为量化喀斯特地区植物叶片功能性状变异及其对环境的响应提供坚实的数据支持，同时也可以为其他宏观尺度上植物功能性状相关的研究提供数据扩展。

数据摘要：

项目	描述
数据集名称	贵州喀斯特地区先锋树种火棘叶片功能性状数据集
所属学科	生态学
研究主题	植物功能性状
数据时间范围	2023年7月-2023年8月
数据地理空间覆盖	贵州省
数据类型与技术格式	.xlsx
数据库（集）组成	数据集包括贵州省喀斯特区域93个采样点406株火棘8120个叶片的叶长、叶宽、叶厚、叶面积、比叶面积的9个形态性状测量值，以及碳、氮、磷及三者化学计量比等6个化学性状数据；同时还包含了93个采样点的土壤有机碳、全氮和全磷含量的实测值。
数据量	1.79 MB
主要数据指标	叶长、叶宽、叶厚、叶面积、叶鲜重、叶干重、叶长宽比、比叶面积、叶片碳含量、叶片氮含量、叶片磷含量。
数据可用性	CSTR: 17058.11.sciencedb.agriculture.00182; https://cstr.cn/17058.11.sciencedb.agriculture.00182 DOI: 10.57760/sciencedb.agriculture.00182; https://doi.org/10.57760/sciencedb.agriculture.00182
经费支持	贵州省科技支撑计划项目（黔科合支撑[2022]一般200）；贵州省基础研究计划项目（黔科合基础[2018]1410）；贵州省野外科学观测研究站建设项目（黔科合平台YWZ[2024]002，黔科合平台YWZ[2024]005）

2023年新疆塔城地区草地类型Landsat8影像训练数据集

杨延晓, 李全胜, 胡林, 张鲜花, 孙伟

2025, 7(2): 255-260. DOI: 10.19788/j.issn.2096-6369.100052

摘要 ( 49 )

HTML ( 1)

PDF (2341KB) ( 25 )

数据和表 | 参考文献 | 相关文章 | 计量指标

草地资源是畜牧业生产的物质基础和生物多样性的基因库，具有防风固沙、涵养水源的生态功能，草地资源调查及监测意义重大。基于卫星遥感的草地分类不仅能够为草地资源调查提供数据支持，也可为草地物种多样性研究提供依据。基于野外调查数据获取真实样地草地类型信息，利用辐射定标、大气校正、图像融合等预处理后的Landsat8遥感影像，通过目视解译遥感判读的方式，使用ArcGIS软件构建了塔城地区8类草地类型共3360张多光谱遥感图像分类训练数据集。本数据集可为塔城地区草地类型遥感图像分类研究提供数据基础，同时可为其他地区相关领域的科研人员提供数据参考。

数据摘要：

项目	描述
数据库（集）名称	2023年新疆塔城地区草地类型Landsat8影像训练数据集
所属学科	农业科学
研究主题	草地类型
数据时间范围	2023年
数据地理空间覆盖	新疆塔城地区，82°16'-87°21′E，43˚25΄-47°15′′N，包括：额敏县、托里县、裕民县、和布克赛尔蒙古自治县、塔城市、沙湾市、乌苏市。
空间分辨率	15 m
数据类型与技术格式	.tif
数据库（集）组成	数据集共包含8个以草地类命名的文件夹，每个文件夹中包含相应草地类型的遥感影像，共3360幅。
数据量	5.74 GB
主要数据指标	低地草甸，温性草原化荒漠，温性草甸草原，温性荒漠草原，山地草甸，温性草原，高寒草甸，温性荒漠
数据可用性	CSTR:17058.11.sciencedb.agriculture.00135; https://cstr.cn/17058.11.sciencedb.agriculture.00135 DOI:10.57760/sciencedb.agriculture.00135; https://doi.org/10.57760/sciencedb.agriculture.00135
经费支持	国家自然科学基金项目（32271880，32060321）

2016—2023年广东省主要农作物审定品种知识图谱构建数据集

高卓君, 张丹丹, 陈荣宇

2025, 7(2): 261-268. DOI: 10.19788/j.issn.2096-6369.100042

摘要 ( 66 )

HTML ( 1)

PDF (2736KB) ( 124 )

数据和表 | 参考文献 | 相关文章 | 计量指标

结合广东省农作物审定品种数据和知识图谱相关技术开展研究。种业是农业产业链的起始环节，是保障国家粮食安全和经济发展的重要支柱，审定品种作为该环节的重要创新资源，经由严格测试和客观评价后予以推广，有效实现种质资源的保护和利用，推动种业高质量发展。随着农业信息化的推进，农业数据量剧增，大数据、人工智能等现代信息技术对提高农业生产效率和优化资源配置带来了突出作用。知识图谱作为人工智能和语义网络的重要分支技术，已广泛应用于各大领域，而农业领域的知识图谱研究，相对侧重作物栽培、水肥管理、病虫害防治等重点问题。本研究基于数据可靠性、实用性、连续性等因素，通过获取广东省农业农村厅公开发布信息，采集了2016—2023年共计8年的广东省农作物审定品种数据作为基础数据，该数据以.doc格式存储，包含大量文字和字符。为便于机器识别及后续知识图谱构建，本研究通过数据清洗去除噪声影响，根据品种特征特性和产量表现提取共性属性，最终整理合并了水稻、玉米、大豆三类农作物审定品种共计823条种质资源数据，并以.xlsx和.json两种格式存储为结构化数据。为验证数据有效性，本研究采用Neo4j图形数据库成功构建了广东省主要农作物审定品种知识图谱。相关科研和生产单位可基于本数据集建立农作物审定品种专家知识库，并通过数据库扩充、多源数据融合等操作，构建面向具体农业任务的智能问答、管理决策、信息推荐等智慧服务。

数据摘要：

项目	描述
数据集名称	2016—2023年广东省主要农作物审定品种知识图谱构建数据集
所属学科	农学其他学科（21099）
研究主题	农作物；农业知识图谱；数据挖掘
数据时间范围	2016—2023年
时间分辨率	年
数据地理空间覆盖	广东省
数据类型与技术格式	.xlsx,.json
数据库（集）组成	1个表格文件和3个文本文件。表格文件包含2016－2023年广东省三类农作物（水稻、玉米、大豆）审定品种共823条种质资源数据；文本文件为水稻、玉米、大豆根据其特征特性和产量表现提取的共性高频属性数据。
数据量	4.18 MB
主要数据指标	作物类别、品种名称、品种来源、生育期、种植时间、形态特征、抗病性、产量表现、平均亩产、种植地区等
数据可用性	CSTR: 17058.11.sciencedb.agriculture.00117; https://cstr.cn/17058.11.sciencedb.agriculture.00117 DOI: 10.57760/sciencedb.agriculture.00117; https://doi.org/10.57760/sciencedb.agriculture.00117
经费支持	广东省岭南特色农业科学数据中心（2021B1212100005）；作物种业数据资源知识融合与共享服务研究（2023KMKS04）

2023年安徽省蚌埠市农产品加工企业情况调查数据集

夏张

2025, 7(2): 269-275. DOI: 10.19788/j.issn.2096-6369.100046

摘要 ( 47 )

HTML ( 1)

PDF (437KB) ( 52 )

数据和表 | 参考文献 | 相关文章 | 计量指标

安徽省蚌埠市地处淮河中游，农业发展优势明显。近年来，蚌埠市市委、市政府高度重视农业产业化发展，扎实推进“农头工尾”增值工作，打造出一批蚌埠市绿色食品品牌。作者对2023年蚌埠市农业企业，特别以农产品加工业为重点,进行了调研。调研指标涉及企业名称、企业类型、利润率、2023年营业收入、2023年研发费用、2023年宣传费用、产品质量体系标准、企业中本科以上人员占比、普通员工平均月薪、企业发展中存在的问题等，调研结果形成安徽省蚌埠市农产品加工企业情况调查数据集。本文提供的2023年蚌埠市农业生产和加工相关数据，可为地方政策制定提供参考。

数据摘要：

项目	描述
数据集名称	2023年安徽省蚌埠市农产品加工企业情况调查数据集
所属学科	农产品加工
研究主题	蚌埠市农产品加工企业
数据时间范围	2023年
数据地理空间覆盖	安徽省蚌埠市
数据类型与技术格式	.xlsx
数据库（集）组成	本数据集由两部分组成：（1）84个样本企业负责人数据集：包含性别信息、年龄信息、受教育水平信息；（2）84个样本企业数据集：包含企业利润率和研发费用占比信息。
数据量	77.51 kB
主要数据指标	年龄、受教育水平、利润率、研发费用占比
数据可用性	CSTR: 17058.11.sciencedb.agriculture.00145; https://cstr.cn/17058.11.sciencedb.agriculture.00145 DOI: 10.57760/sciencedb.agriculture.00145; https://doi.org/10.57760/sciencedb.agriculture.00145
经费支持	蚌埠市社科联一般项目

2021-2023年京津冀蔬菜产销监测数据集

陈丽, 王剑, 赵安平, 王晓东, 刘娟, 王诗睿, 宁晓涵, 王增飞, 杨唯佳

2025, 7(2): 276-280. DOI: 10.19788/j.issn.2096-6369.100054

摘要 ( 67 )

HTML ( 7)

PDF (536KB) ( 55 )

数据和表 | 参考文献 | 相关文章 | 计量指标

蔬菜是农民增收致富的“钱袋子”，也是城市居民餐桌上的“菜篮子”。京津冀协同发展下，动态监测蔬菜产销信息对于稳固区域蔬菜供应、提升农业资源配置效率、增加农民收入以及推动区域一体化发展具有重要意义。本数据集汇聚了京津冀地区2021—2023年108种蔬菜的产销数据，包括种植面积、种植方式、销售价格、销售数量、销售去向、销售渠道等。数据涵盖京津冀地区83个区县，415个微观生产主体监测点，涉及蔬菜种植大户、家庭农场、合作社和企业。本数据集可为该区域蔬菜种植规划、产量与价格预测、市场供需等研究等提供数据支撑。

数据摘要：

项目	描述
数据库（集）名称	2021—2023年京津冀蔬菜产销监测数据集
所属学科	农业科学
研究主题	蔬菜生产销售
数据时间范围	2021-2023年
时间分辨率	日
数据地理空间覆盖	北京、天津、河北
空间分辨率	监测点
数据类型与技术格式	.xlsx
数据库（集）组成	表格文件1个，包含2021－2023年京津冀415个蔬菜产销监测点蔬菜生产、销售数据。
数据量	91.5 MB
主要数据指标	种植品种、种植面积、定植日期、品质、种植方式、上市日期、销售日期、销量、销售价格、销售去向、销售渠道
数据可用性	CSTR:sciencedb.agriculture.00193; https://cstr.cn/17058.11.sciencedb.agriculture.00193 DOI:10.57760/sciencedb.agriculture.00193; https://doi.org/10.57760/sciencedb.agriculture.00193
经费支持	2024年农产品市场信息采集分析项目；北京市乡村振兴农业科技项目（NY2502270125）

当期目录