阅读排行
一年内发表文章 |  两年内 |  三年内 |  全部
Please wait a minute...
选择: 显示/隐藏图片
1. 农业病虫害信息检索数据集
王甄, 覃锋, 乔曦, 黄聪, 刘博, 万方浩, 王陈骄子, 黄亦其
农业大数据学报    2025, 7 (3): 379-392.   DOI: 10.19788/j.issn.2096-6369.100053
摘要834)   HTML63)    PDF(pc) (1936KB)(802)    收藏

随着自然语言处理和信息检索技术的快速发展,知识的有效提取与应用在农业领域的重要性日益凸显。信息检索的核心在于根据用户的查询需求,从知识库中快速、精准地定位相关信息。然而,由于中国农业领域缺乏高质量的文本数据集,限制了农业病虫害信息检索技术的进一步发展。此外,传统搜索引擎在农业领域的信息检索中表现出效率低下和准确性不足的问题,用户往往需要耗费大量时间和精力对海量、无序的数据信息进行二次筛选和整理,以获取有价值的农业知识。针对上述问题,本文通过整理实验室多年积累的关于动物、植物、病害以及入侵生物的文本数据,并结合广泛的文献调研数据,经过自动化或半自动化数据清洗、去噪等过程,将非结构化的数据重新组合成结构化的数据,最终以excel的方式进行存储。所构建的农业信息检索数据集包含国内农业病虫害、外来入侵物种、检疫性物种三大类。其中农业病虫害包含83种农作物相关的1254种病害和440种虫害;外来入侵物种包含70种外来入侵动物和130种外来入侵植物;检疫性物种包含99种昆虫、9种软体动物、19种真菌、25种原核生物、18种线虫、37种病毒及类病毒以及42种杂草。共计2143种病虫害。该数据集覆盖品类较为广泛,能够为农业信息检索、防疫检疫、农业领域数据库构建等人机交互友好的智能应用研发提供基础数据支撑,同时为从事有害生物相关工作的科研机构和职能部门提供外来相关数据查询。

数据摘要:

项目 描述
数据库(集)名称 农业病虫害信息检索数据集
所属学科 计算机科学与技术(520);农学其他学科(210.99)
研究主题 农业信息检索;数据挖掘;人工智能
数据时间范围 2012年-2024年
数据地理空间覆盖 中国
数据类型与技术格式 .xlsx
数据库(集)构成 由3个excel格式的文件构成,分别包含国内农业病虫害、外来入侵物种、检疫性物种三大类。其中农业病虫害包含83种农作物相关的1 254种病害和440种虫害;外来入侵物种包含70种外来入侵动物和130种外来入侵植物;检疫性物种包含99种昆虫、9种软体动物、19种真菌、25种原核生物、18种线虫、37种病毒及类病毒以及42种杂草。共计2 143种病虫害。
数据量 4.96 MB
主要数据指标 病虫害类别
数据可用性 CSTR:17058.11.sciencedb.agriculture.00187; https://cstr.cn/17058.11.sciencedb.agriculture.00187
DOI:10.57760/sciencedb.agriculture.00187; https://doi.org/10.57760/sciencedb.agriculture.00187
经费支持 国家重点研发计划(2021YFD1400100、2021YFD1400102、2021YFD1400101)、中国农业科学院科技创新工程(CAAS-ZDRW202505)。
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
2. AI知识蒸馏技术演进与应用综述
毛克彪, 代旺, 郭中华, 孙学宏, 肖柳瑞
农业大数据学报    2025, 7 (2): 144-154.   DOI: 10.19788/j.issn.2096-6369.000106
摘要495)   HTML32)    PDF(pc) (1491KB)(739)    收藏

人工智能(AI)中知识蒸馏(KD)技术通过构建师生框架实现模型轻量化,成为解决深度学习性能与效率瓶颈的关键技术。本文从算法原理演进的视角,系统解析知识蒸馏的理论框架,将知识迁移路径归纳为基于响应、特征、关系及结构四类范式,并构建动态与静态知识蒸馏方法的对比评估体系。我们深入探讨了跨模态特征对齐、自适应蒸馏架构及多教师协同验证等创新机制,同时剖析渐进式知识迁移与对抗蒸馏等融合策略。通过计算机视觉与自然语言处理领域的实证分析,评估了该技术在图像分类、语义分割及文本生成等场景中的实用性。特别地,我们强调了知识蒸馏在农业与地学领域的潜力,例如在资源受限环境下的精准农业和地理空间分析中实现高效部署。研究发现当前模型普遍存在知识选择机制模糊、理论解释性不足等瓶颈问题。据此,我们探讨了自动化蒸馏系统与多模态知识融合等前沿方向的可行性,为边缘智能部署及隐私计算提供了新的技术路径,尤其适用于农业智能化与地学研究。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
3. 基于人工标注与对比生成模型的玉米叶病图文多模态数据集
王彦芳, 鲜国建, 赵瑞雪
农业大数据学报    2025, 7 (3): 371-378.   DOI: 10.19788/j.issn.2096-6369.100060
摘要458)   HTML36)    PDF(pc) (1322KB)(481)    收藏

玉米叶部病害的精准识别是农业智能化管理的重要环节。现有玉米病害数据集存在质量参差不齐、标签类别模糊、多模态数据匮乏等问题,尤其是中文语境下的病害描述数据的稀缺性。本研究整合了自建数据与AI Challenger、Plant Village及OpenDataLab开源的玉米叶部病害高清图像数据,并由人工基于文献、专业书籍及科学数据等先验知识对图像进行诊断性文本描述标注,共构建了中文语境下的1 653组图像-文本对多模态数据集。其中,每张图像对应的文本模态内容涵盖病害类型、病状特征及严重程度等关键信息。在此基础上,探索使用CN-CLIP与GPT2-Chinese大模型组合生成图像描述的补充增强内容,丰富描述文本模态数据的多样性,为图像自动标注提供实践验证。本数据集可为玉米病害智能诊断模型开发、中文图像描述生成及农业多模态知识图谱构建提供高质量数据样本支撑。

数据摘要:

项目 描述
数据库(集)名称 基于人工标注与对比生成模型的玉米叶病图文多模态数据集
所属学科 农业科学,计算机科学
研究主题 计算机视觉,跨模态检索,图像描述生成
数据类型与技术格式 .jpg
数据库(集)组成
数据集由图像数据和对应的文本描述数据组成,其中:图像数据集包括玉米大斑病、小斑病、褐斑病、弯孢霉叶斑病、普通锈病、南方锈病、灰斑病、圆斑病和矮花叶病等9种典型叶部病害原始图像数据,共1 653幅;文本数据,描述对应图像的作物名称、病害类型、病斑位置、数量、颜色及形状等细粒度病害特征,平均长度约32字符数,共1653条。
数据量 3.87 GB
主要数据指标 图像与其对应的描述文本
数据可用性
CSTR:17058.11.sciencedb.agriculture.00226; https://cstr.cn/17058.11.sciencedb.agriculture.00226
DOI:10.57760/sciencedb.agriculture.00226; https://doi.org/10.57760/sciencedb.agriculture.00226
经费支持 新一代人工智能国家科技重大专项(2021ZD0113705)。
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
4. 推动现代农业转型:智慧农业发展的思考与展望
孔繁涛, 赵仁杰, 张鑫蕊, 刘振虎, 曹姗姗
农业大数据学报    2025, 7 (2): 155-160.   DOI: 10.19788/j.issn.2096-6369.000090
摘要421)   HTML32)    PDF(pc) (397KB)(439)    收藏

随着信息技术的快速发展,智慧农业作为现代农业的重要发展方向,正逐渐成为推动我国农业转型升级的关键力量。本文通过对国内外智慧农业的研究现状进行综述,探讨了其在我国的具体实践情况和发展趋势。文章指出,智慧农业不仅能够提升农业生产效率和产品质量,还为解决传统农业面临的诸多问题提供了新思路。在技术层面,物联网、大数据、云计算等新兴技术的应用,使得农业生产过程更加智能化和精准化;而在管理方面,则强调通过构建综合服务平台来优化资源配置,提高服务效能。此外,政策支持对于智慧农业的发展至关重要,政府应加大对基础设施建设和人才培养的投入,建立健全相关法律法规体系以保障数据安全。同时,鼓励社会各界积极参与到智慧农业建设中来,形成多方协同的良好局面。最后,本文提出了未来智慧农业需要重点关注的几个方向:一是深化技术研发,二是加强跨领域合作,三是注重实践经验总结与推广。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
5. 一种基于改进YOLO的小目标检测模型
叶端南, 李根田
农业大数据学报    2025, 7 (2): 173-182.   DOI: 10.19788/j.issn.2096-6369.000073
摘要328)   HTML12)    PDF(pc) (2238KB)(106)    收藏

随着深度学习技术的快速发展,目标检测在多个领域得到广泛应用。然而,小目标检测由于其尺寸小、特征不明显,导致检测性能受限。为了解决这一问题,本文提出了一种基于YOLOv8的改进目标检测模型。该模型集成了幽灵瓶颈网络、多尺度自由注意力模块、改进特征金字塔网络和动态Soft-NMS等优化策略,旨在提升密集小目标的检测精度和模型的计算效率。通过在自制数据集上的实验验证,改进YOLO模型在精度、召回率和mAP@0.5等关键指标上均优于现有主流模型,有效平衡了模型的参数量和浮点计算量。实验结果表明,所提方法在保证检测精度的同时,实现了模型的轻量化,为资源受限的嵌入式设备上的目标检测任务提供了有效的解决方案。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
6. 基于改进YOLOv8的番茄目标检测算法研究
吴丹, 马晓君, 刘德胜, 宋伟, 苏文献
农业大数据学报    2025, 7 (3): 281-293.   DOI: 10.19788/j.issn.2096-6369.000075
摘要320)   HTML28)    PDF(pc) (3836KB)(688)    收藏

随着农业智能化进程的加快,基于深度学习、机器人等人工智能技术在农业生产中的应用也越来越受到关注。针对现有番茄果实识别方法在复杂环境下误识率高、定位精度低和采摘效率低等问题,本文提出了一种改进的YOLOv8网络模型,旨在提高番茄果实自动化采摘的检测精度和速度。 该网络以YOLOv8为初始模型,在其骨干网络中添加了可变形卷积模块(DCN),有效提升模型对小目标的检测精度,降低漏检率;在Neck端引入SE注意力机制模块,提高对检测目标的关注度;采用Inner-IoU损失函数来替代原有的CIoU损失函数,提高目标检测中边界框的回归精度。本研究将改进后的YOLOv8模型与SSD、YOLOv4、YOLOv5、YOLOv7网络模型对比,平均精度分别提高了7.2、6.4、6.6、7.7个百分点,改进后的YOLOv8模型较原模型的准确率提升了3.8%,召回率上升了0.6%,同时mAP@0.5和mAP@[0.5:0.95]分别提高了约2.6%和1.9%。研究表明改进的YOLOv8模型能够有效提高番茄果实的自动化采摘检测精度和速度,对实现番茄的自动化采摘具有重要意义。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
7. 2021-2023年京津冀蔬菜产销监测数据集
陈丽, 王剑, 赵安平, 王晓东, 刘娟, 王诗睿, 宁晓涵, 王增飞, 杨唯佳
农业大数据学报    2025, 7 (2): 276-280.   DOI: 10.19788/j.issn.2096-6369.100054
摘要314)   HTML46)    PDF(pc) (536KB)(161)    收藏

蔬菜是农民增收致富的“钱袋子”,也是城市居民餐桌上的“菜篮子”。京津冀协同发展下,动态监测蔬菜产销信息对于稳固区域蔬菜供应、提升农业资源配置效率、增加农民收入以及推动区域一体化发展具有重要意义。本数据集汇聚了京津冀地区2021—2023年108种蔬菜的产销数据,包括种植面积、种植方式、销售价格、销售数量、销售去向、销售渠道等。数据涵盖京津冀地区83个区县,415个微观生产主体监测点,涉及蔬菜种植大户、家庭农场、合作社和企业。本数据集可为该区域蔬菜种植规划、产量与价格预测、市场供需等研究等提供数据支撑。

数据摘要:

项目 描述
数据库(集)名称 2021—2023年京津冀蔬菜产销监测数据集
所属学科 农业科学
研究主题 蔬菜生产销售
数据时间范围 2021-2023年
时间分辨率
数据地理空间覆盖 北京、天津、河北
空间分辨率 监测点
数据类型与技术格式 .xlsx
数据库(集)组成 表格文件1个,包含2021-2023年京津冀415个蔬菜产销监测点蔬菜生产、销售数据。
数据量 91.5 MB
主要数据指标 种植品种、种植面积、定植日期、品质、种植方式、上市日期、销售日期、销量、销售价格、销售去向、销售渠道
数据可用性 CSTR:sciencedb.agriculture.00193; https://cstr.cn/17058.11.sciencedb.agriculture.00193
DOI:10.57760/sciencedb.agriculture.00193; https://doi.org/10.57760/sciencedb.agriculture.00193
经费支持 2024年农产品市场信息采集分析项目;北京市乡村振兴农业科技项目(NY2502270125)
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
8. 多学科通用型开放科学数据共享平台对比研究——以Zenodo和ScienceDB为例
贺郝钰, 侯春梅, 孙力炜, 迟秀丽, 叶喜艳
农业大数据学报    2025, 7 (2): 193-200.   DOI: 10.19788/j.issn.2096-6369.000063
摘要281)   HTML6)    PDF(pc) (623KB)(910)    收藏

通过对两个具有代表性的多学科通用型科学数据共享平台——Zenodo和ScienceDB的比较分析,探讨它们在功能、服务、社区协作等方面的异同,并提出其各自的优势和潜在的改进空间。这一研究的意义在于为科研数据平台的优化和完善提供参考,促进科学数据的高效管理和利用,从而为科学研究的进步做出贡献。研究采用对比分析法,深入探讨了Zenodo和ScienceDB在数据存储、共享机制、用户界面设计、技术支持、社区互动、数据安全与隐私保护等方面的特点和差异。分析过程中,详细对比了两个平台的数据提交与描述、元数据要求、数据服务、数据统计和社区服务等多个方面,以评估它们在科研数据管理领域的服务能力与特色。Zenodo以其友好的用户界面、灵活的技术架构和强大的社区功能在国际上享有盛誉,而ScienceDB则凭借其对FAIR原则的遵循和对数据治理的重视,为中国乃至全球的科研数据共享提供了有力支持。两个平台各有优势,但也存在改进空间。Zenodo可以进一步强化数据的本地化服务,ScienceDB则可以借鉴Zenodo在社区管理的经验,提升用户体验。最终,两个平台的持续发展和优化将共同推动科学研究的进步和知识的传播。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
9. 2023年度深圳红树林植被群落结构数据集
黄桂松, 肖佑鹏, 麦有全, 孙文郡, 黎栩霞, 徐旭, 王伟民, 王裕东, 黄振国, 王海鹏, 陈伊梦, 林俊川, 许旺
农业大数据学报    2025, 7 (3): 400-409.   DOI: 10.19788/j.issn.2096-6369.100056
摘要268)   HTML17)    PDF(pc) (819KB)(171)    收藏

我国目前正在努力完成碳达峰的目标,以红树林湿地为代表的“蓝碳”正是碳汇领域不可或缺的一部分。2020年,自然资源部印发了《红树林保护修复专项计划行动(2020-2025)》,近年来取得良好成效,深圳作为海洋中心城市,红树林资源相对较为丰富,对典型海岸带红树林生态系统基本状况及红树林物种的全面调查既能够更好的了解区域内的物种群落结构组成,还能够评估红树林养护计划的成果。根据本市红树林地理分布和群落结构,于2023年夏季选取了9条典型红树林监测样点,24个样地。通过无人机,结合现场踏查和固定样方调查的方式,采用面积加权平均法求得全市红树林的单位面积植被生物量。地上植物生物量通过异速生长方程法,结合样方调查结果计算深圳海岸带红树林的分布范围和面积。通过现场测量和记录不同植株指标,同时通过现场鉴定植物种类组成等记录群落指标,得到本数据集。本数据集包含以下几个特点:(1)本数据集内容较为充实,涵盖样点的经纬度、样点的生物信息、群落结构、群落特征;(2)提供的区域范围较广,涵盖了整个深圳市域所有红树林集中存在的点位;(3)采用实地踏查、固定样方的调查方式,误差较小。利用本数据集可以发掘大湾区红树林湿地的分布和治理现状,并且可与碳通量、碳储量的调查,或水质、大气的环境调查相结合,对生态环境监测调查研究具有重要意义。

数据摘要:

项目 描述
数据集名称 2023年度深圳红树林植被群落结构数据集
所属学科 环境工程,生态学,农学
研究主题 红树林群落结构
数据时间范围 2023年6月1日-8月31日
数据地理空间覆盖 地理范围为113.819-115.039°E,22.469-22.773°N,地理区域范围涉及的地区为广东省深圳市和汕尾市(深汕特别合作区)
数据类型与技术格式 .xls
数据库(集)组成
数据集共包含1个数据文件,4个表单:(1)9个样点的经纬度信息;(2)24个监测样方的生物信息,包括了分布密度、植物类型等;(3)9个样点主要红树植物群落信息,包括平均株高、平均冠幅和胸径;(4)调查得到的深圳市红树林植物名录,共包含7个目10个科13个属17个种。
数据量 36.5 KB
主要数据指标 监测点位、物种名、株高、冠幅、胸(基)径
数据可用性
CSTR:31253.11.sciencedb.15120; https://cstr.cn/31253.11.sciencedb.15120
DOI:10.57760/sciencedb.15120; https://doi.org/10.57760/sciencedb.15120
经费支持 深圳市可持续发展科技专项(KCXST20221021111404011)
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
10. 2016—2023年广东省主要农作物审定品种知识图谱构建数据集
高卓君, 张丹丹, 陈荣宇
农业大数据学报    2025, 7 (2): 261-268.   DOI: 10.19788/j.issn.2096-6369.100042
摘要247)   HTML10)    PDF(pc) (2736KB)(257)    收藏

结合广东省农作物审定品种数据和知识图谱相关技术开展研究。种业是农业产业链的起始环节,是保障国家粮食安全和经济发展的重要支柱,审定品种作为该环节的重要创新资源,经由严格测试和客观评价后予以推广,有效实现种质资源的保护和利用,推动种业高质量发展。随着农业信息化的推进,农业数据量剧增,大数据、人工智能等现代信息技术对提高农业生产效率和优化资源配置带来了突出作用。知识图谱作为人工智能和语义网络的重要分支技术,已广泛应用于各大领域,而农业领域的知识图谱研究,相对侧重作物栽培、水肥管理、病虫害防治等重点问题。本研究基于数据可靠性、实用性、连续性等因素,通过获取广东省农业农村厅公开发布信息,采集了2016—2023年共计8年的广东省农作物审定品种数据作为基础数据,该数据以.doc格式存储,包含大量文字和字符。为便于机器识别及后续知识图谱构建,本研究通过数据清洗去除噪声影响,根据品种特征特性和产量表现提取共性属性,最终整理合并了水稻、玉米、大豆三类农作物审定品种共计823条种质资源数据,并以.xlsx和.json两种格式存储为结构化数据。为验证数据有效性,本研究采用Neo4j图形数据库成功构建了广东省主要农作物审定品种知识图谱。相关科研和生产单位可基于本数据集建立农作物审定品种专家知识库,并通过数据库扩充、多源数据融合等操作,构建面向具体农业任务的智能问答、管理决策、信息推荐等智慧服务。

数据摘要:

项目 描述
数据集名称 2016—2023年广东省主要农作物审定品种知识图谱构建数据集
所属学科 农学其他学科(21099)
研究主题 农作物;农业知识图谱;数据挖掘
数据时间范围 2016—2023年
时间分辨率
数据地理空间覆盖 广东省
数据类型与技术格式 .xlsx,.json
数据库(集)组成 1个表格文件和3个文本文件。表格文件包含2016-2023年广东省三类农作物(水稻、玉米、大豆)审定品种共823条种质资源数据;文本文件为水稻、玉米、大豆根据其特征特性和产量表现提取的共性高频属性数据。
数据量 4.18 MB
主要数据指标 作物类别、品种名称、品种来源、生育期、种植时间、形态特征、抗病性、产量表现、平均亩产、种植地区等
数据可用性
CSTR: 17058.11.sciencedb.agriculture.00117; https://cstr.cn/17058.11.sciencedb.agriculture.00117
DOI: 10.57760/sciencedb.agriculture.00117; https://doi.org/10.57760/sciencedb.agriculture.00117
经费支持 广东省岭南特色农业科学数据中心(2021B1212100005);作物种业数据资源知识融合与共享服务研究(2023KMKS04)
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
11. 榴莲99份种质资源变异位点数据集
冀晓昊, 郑道君, 谢圣华, 时梦, 钟义旺, 王莹莹, 王孝娣, 刘凤之, 冯学杰, 王海波
农业大数据学报    2025, 7 (2): 227-237.   DOI: 10.19788/j.issn.2096-6369.100040
摘要241)   HTML9)    PDF(pc) (695KB)(212)    收藏

榴莲具有较高的经济价值和营养价值。我国榴莲高度依赖进口,海南省榴莲产业处于刚刚起步阶段,存在面积少、产量低、品种完全依赖引种而缺乏自主性、配套栽培技术欠缺等诸多问题,导致市场需求大而产业薄弱的矛盾突出,迫切需要进行榴莲种质资源收集、鉴定与评价。该研究对99份榴莲种质资源提取DNA,构建文库并开展了二代全基因组测序,对测序数据开展了质控、变异位点挖掘注释和群体进化等生信分析。测序数据量共计1.62 Tb,共挖掘到54 974 697个变异位点,包括SNP、INS和DEL三种变异类型,以SNP为主,榴莲基因组中平均每13个碱基有1个变异位点,变异位点主要位于基因间,位于基因外显子和内含子的较少。99份榴莲资源可以分成3个亚群,LD系数降低到最大值的一半的衰减距离只有0.1-0.2 kb,表现出丰富的遗传多样性。99份榴莲种质资源的基因组测序数据和变异位点信息,为榴莲遗传学以及育种方法和育种理论研究提供了基础数据支撑,有助于海南乃至世界榴莲品种选育。

数据摘要:

项目 描述
数据库(集)名称 榴莲99份种质资源变异位点数据集
所属学科 农学,生物学
研究主题 榴莲种质资源遗传变异
数据时间范围 2022年-2023年
时间分辨率 1年
数据地理空间覆盖 海南省三亚市
数据类型与技术格式 .XLSX和VCF
数据库(集)组成 本数据集由1个表格和1个VCF文件组成,主要包括WGS测序数据质控结果、比对情况和变异位点信息。
数据量 143.36 GB
数据可用性 CSTR:17058.11.sciencedb.agriculture.00077;https://cstr.cn/17058.11.sciencedb.agriculture.00077
DOI:10.57760/sciencedb.agriculture.00077; https://doi.org/10.57760/sciencedb.agriculture.00077
经费支持 中国农业科学院南繁专项(SWAQ09);中国农业科学院创新工程项目(CAAS-ASTIP-2021-RIP-02)
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
12. 作物性状调控基因知识图谱数据集
张丹丹, 赵瑞雪, 宼远涛, 鲜国建
农业大数据学报    2025, 7 (2): 220-226.   DOI: 10.19788/j.issn.2096-6369.100051
摘要241)   HTML15)    PDF(pc) (492KB)(175)    收藏

当前,作物育种相关的多维度科学数据呈指数级增长,这些半结构化和结构化的科学数据分布在不同领域科学数据库中,缺少跨物种多维度科学数据的关联融合数据集,阻碍了已有作物育种知识的迁移复用与作物育种科学数据价值的最大化发挥,这为作物性状调控基因知识发现带来了挑战。本研究基于数据的可靠性、实用性、易用性等原则,选取PubMed文献数据库与Phytozome、Ensembl plants、UniProt、RGAP、STRING、Pfam、KEGG和GO作为数据获取来源,采用多路径知识抽取的方式对不同数据格式的科学数据分别进行实体及关系的抽取。面向结构化数据的映射知识抽取;面向XML半结构化数据,采用基于Kettle进行数据解析的知识抽取;面向FASTA半结构化数据,采用基于BLAST模型计算的知识抽取。面向Text非结构化数据,采用基于大语言模型的知识抽取。在完成以上实体和关系抽取的基础上,进一步基于实体映射和特定属性关联的方式,实现多源作物育种知识的关联融合。形成了作物性状调控基因知识图谱数据集,并以.csv格式存储为结构化数据。该数据集包含13个实体数据集和14个语义关系数据集。为了验证该数据集的有效性,采用Neo4j图数据库进行数据集存储。最终,形成了涵盖约13万个节点和55万条语义关系的作物性状调控基因知识图谱,可有效支撑跨物种基因知识的关联检索。作物性状调控基因知识图谱数据集已为优异多效基因发现、跨物种基因功能预测与通路基因网络潜在发现等作物育种知识发现提供了关键的语义模型和重要的数据基础。相关科研和生产单位可基于本数据集构建作物性状调控基因知识库,为作物育种知识发现服务平台的构建提供关键的知识资源底座。

数据摘要:

项目 描述
数据集名称 作物性状调控基因知识图谱数据集
所属学科 农学其他学科(21099)
研究主题 作物;性状调控基因知识图谱;数据挖掘
数据类型与技术格式 .csv
数据库(集)组成 27个表格文件,包含水稻、玉米、小麦、拟南芥跨物种关联融合的13个实体数据集与14个语义关系数据集。
数据量 32.18 MB
主要数据指标 转录组名称、功能描述、物理位置、物种等
数据可用性 CSTR: 17058.11.sciencedb.agriculture.00175; https://cstr.cn/17058.11.sciencedb.agriculture.00175
DOI: 10.57760/sciencedb.agriculture.00175; https://doi.org/10.57760/sciencedb.agriculture.00175
经费支持 中国农业科学院科技创新工程(CAAS-ASTIP-2016-AII)
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
13. 基于PSA-YOLO11n的小麦害虫检测
康继昌, 赵连军
农业大数据学报    2025, 7 (3): 294-306.   DOI: 10.19788/j.issn.2096-6369.000101
摘要238)   HTML15)    PDF(pc) (5739KB)(130)    收藏

针对自然环境中小麦害虫种类繁多、尺寸差异大和生长环境复杂导致检测精度低的问题,提出了一种PSA-YOLO11n小麦害虫检测算法,以提升小麦害虫的检测精度。在 YOLO11n 算法的基础上,对三个关键组成部分进行改进:1)在主干部分引入一种改进空间金字塔池化SimCSPSPPF(Sim CSP Spatial Pyramid Pooling - Fast,SimCSPSPPF) 模块,降低隐藏层的通道数量,加快模型训练速度。2)在中间部分将普通卷积替换为效果更好的感知增强卷积(Perception enhancement convolution,PEC),增强多尺度特征提取能力,提升目标检测速度。 3)回归损失函数更换为AWIoU(Adequate Wise IoU ),改善害虫种类繁多、尺寸差异大造成的检测框失真,提升边界框定位能力。利用IP102数据集进行试验验证,PSA-YOLO11n 与 YOLO11n 相比,mAP提升0.8%,达到89.10%。与Faster R-CNN、RetinaNet、YOLOv5s、YOLOv8n 、YOLOv10n和 YOLO11n 等主流算法进行比较,模型性能均优于其它对比算法。试验结果表明,改进算法PSA-YOLO11n,显著提升了自然环境下多尺度小麦害虫检测精度,为小麦病虫害防治提供一种有效的解决方案。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
14. 贵州喀斯特地区先锋树种火棘叶片功能性状数据集
杜娇艳, 张红玉, 李安定, 曹洋, 蔡国俊
农业大数据学报    2025, 7 (2): 246-245.   DOI: 10.19788/j.issn.2096-6369.100047
摘要238)   HTML2)    PDF(pc) (2794KB)(167)    收藏

研究植物叶片功能性状对环境变化的响应,有助于揭示植物适应策略,植物叶片功能性状数据库(集)已成为宏观尺度上研究植物适应策略以及宏观生态学研究的重要工具,但在宏观尺度上,仍较缺乏针对某一物种和某一特定生境的植物叶片功能性状数据以供分析研究。我们于2023年7月至8月,采集了广泛分布于贵州省喀斯特地区的先锋树种火棘 (Pyracantha fortuneana),共计93个样点406株植物的8120个叶片,测定和计算了叶片湿重、叶片干重、叶长、叶宽、叶面积、比叶面积等9个形态性状以及叶片碳、氮、磷含量及其计量比等6个化学性状指标,同时采集了93个采样点的土壤样品,测定了土壤有机碳含量、全氮含量和全磷含量,汇编为“贵州喀斯特地区先锋树种火棘叶片功能性状数据集”,数据集包括:(1)功能性状的说明;(2)采样点地理信息及简要环境描述;(3)8120个叶片的形态性状实测数据;(4)406株火棘的叶片碳、氮、磷化学计量特征;(5)93个采样点的土壤有机碳、全氮、全磷含量数据;(6)8120个叶片的形态性状样点平均值。该数据集可以为量化喀斯特地区植物叶片功能性状变异及其对环境的响应提供坚实的数据支持,同时也可以为其他宏观尺度上植物功能性状相关的研究提供数据扩展。

数据摘要:

项目 描述
数据集名称 贵州喀斯特地区先锋树种火棘叶片功能性状数据集
所属学科 生态学
研究主题 植物功能性状
数据时间范围 2023年7月-2023年8月
数据地理空间覆盖 贵州省
数据类型与技术格式 .xlsx
数据库(集)组成 数据集包括贵州省喀斯特区域93个采样点406株火棘8120个叶片的叶长、叶宽、叶厚、叶面积、比叶面积的9个形态性状测量值,以及碳、氮、磷及三者化学计量比等6个化学性状数据;同时还包含了93个采样点的土壤有机碳、全氮和全磷含量的实测值。
数据量 1.79 MB
主要数据指标 叶长、叶宽、叶厚、叶面积、叶鲜重、叶干重、叶长宽比、比叶面积、叶片碳含量、叶片氮含量、叶片磷含量。
数据可用性 CSTR: 17058.11.sciencedb.agriculture.00182; https://cstr.cn/17058.11.sciencedb.agriculture.00182
DOI: 10.57760/sciencedb.agriculture.00182; https://doi.org/10.57760/sciencedb.agriculture.00182
经费支持 贵州省科技支撑计划项目(黔科合支撑[2022]一般200);贵州省基础研究计划项目(黔科合基础[2018]1410);贵州省野外科学观测研究站建设项目(黔科合平台YWZ[2024]002,黔科合平台YWZ[2024]005)
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
15. 林业数据分类分级方法研究
薛亚东, 秦琳, 黄宁辉, 孟先进, 张水花
农业大数据学报    2025, 7 (2): 213-219.   DOI: 10.19788/j.issn.2096-6369.000091
摘要231)   HTML11)    PDF(pc) (421KB)(128)    收藏

随着林业信息化技术的快速发展,林业领域逐渐意识到数据资源的重要性。本研究旨在通过研究分类分级方法对林业数据进行系统化管理。首先,将林业数据依据用途分为林业基础地理数据、林业调查规划数据、林业业务数据和公共数据四大类;其次,根据数据遭到篡改、破坏、泄露或非法获取的潜在危害程度,将其分为1-4级四个安全级别。通过制定林业数据共享服务规范,建立在内网、政务网、互联网三网环境下的数据安全管理体系,实现数据交换、分发及应用的规范化和制度化,从而促进林业数据在业务中的共享服务和协同应用。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
16. 农业科学数据本体网络系统研发
陈晓静, 赵晓燕, 贺子康, 林佳, 李佳乐, 申家炜, 樊景超, 闫燊, 王健, 张建华, 周国民
农业大数据学报    2025, 7 (2): 201-212.   DOI: 10.19788/j.issn.2096-6369.000083
摘要213)   HTML10)    PDF(pc) (4371KB)(147)    收藏

农业科学数据本体网络的构建是农业科学数据分析挖掘的重要内容。它可以将分散在不同数据库、不同格式的数据进行集成,将不同领域的数据进行关联和整合,形成更全面的数据池,支持跨领域跨学科数据的自动分析挖掘,发现隐藏的知识、模式和趋势。本研究构建了包含农业、作物、基因、序列等相关28个农业科学数据本体的数据库,制定了农业科学数据本体存储标准,搭建了基于HugeGraph图数据库的农业科学数据本体网络,建立“数据集-数据记录-信息实体”映射关系机制,并且设计了农业科学数据本体网络系统技术框架。系统实现了自动化导入、自动管理和本体网络可视化等功能,突破当前农业本体数量多、数据量大、缺少专有系统进行管理等突出问题,研发了集大规模多格式农业科学数据本体导入、本体管理、本体内和跨本体映射关系编辑、本体网络可视化等四大类功能于一体的农业科学数据本体网络系统,有力提升了农业科学数据本体管理能力,支撑海量数据资源高效语义关联发布以及跨领域跨学科的数据自动聚合,为农业科学数据在线分析挖掘奠定了基础。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
17. 188个鲜食葡萄品种果皮中花色苷组分数据集
武亚敬, 冀晓昊, 于祎飞, 时梦, 王宝亮, 王孝娣, 刘凤之, 李明亮, 王贺, 刘俊, 王海波
农业大数据学报    2025, 7 (2): 238-245.   DOI: 10.19788/j.issn.2096-6369.100020
摘要203)   HTML15)    PDF(pc) (2064KB)(51)    收藏

葡萄果皮色泽从青色到黄色,再到红色、紫色乃至黑色,表现出了丰富的遗传多样性。花色苷的组分和含量是葡萄果皮红色形成的物种基础。采用HPLC和HPLC-MS/MS的方法对188个葡萄品种果皮花色苷进行了定性和定量分析。热图和主成分分析发现不同品种的花色苷组成和含量表现出了丰富的多态性和特异性,花色苷组分含量可以作为葡萄品种鉴定的辅助指标。葡萄品种花色苷总含量与组分个数总体上呈正相关关系,即花色苷的含量越高,组分种类也越多;含量越低,组分种类也越少。芍药素-3-葡萄糖苷、矢车菊素-3-葡萄糖苷、锦葵素-3-葡萄糖苷、飞燕草素-3-葡萄糖苷和矮牵牛素3-葡萄糖苷是葡萄中出现频率和含量较高的几种花色苷组分,非酰基化修饰组分的含量高于酰基化修饰组分的含量,锦葵素的酰基化修饰组分含量要高于其他种类花色素。最高含量花色苷组分共发现7种,其中芍药素-3-葡萄糖苷占比最高,其次是矢车菊素-3-葡萄糖苷和锦葵素-3-葡萄糖苷。花色苷总含量与酰基化组分总含量表现出正相关,但也发现一些不发生酰基化或酰基化程度特别低的品种。本研究提供了188个葡萄品种果皮花色苷组分和含量的翔实数据,为研究葡萄色泽形成机制提供了重要的理论基础和数据支持。

数据摘要:

项目 描述
数据库(集)名称 188个鲜食葡萄品种果皮中花色苷组分数据集
所属学科 农学,生物学
研究主题 葡萄花色苷组分与含量
数据时间范围 2022年—2023年
时间分辨率 1年
数据地理空间覆盖 河北省张家口市怀来县
数据类型与技术格式 .xlsx
数据库(集)组成 本数据集由8个表格数据组成,主要包括188个葡萄品种果皮花色苷高效液相测定结果的组分名称、峰面积和含量。
数据量 186 KB
数据可用性 CSTR:17058.11.sciencedb.agriculture.00042; https://cstr.cn/17058.11.sciencedb.agriculture.00042
DOI:10.57760/sciencedb.agriculture.00042; https://doi.org/10.57760/sciencedb.agriculture.00042
经费支持 国家重点研发计划(2023YFD1200100);国家农业科技园区专项(2021C-01);山东省重点研发计划(2022TZXD0010);中国农业科学院创新工程项目(CAAS-ASTIP-2021-RIP-02);怀来葡萄与葡萄酒产业科技特派团
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
18. 基于车载相机和HLS时序遥感数据的作物分类研究
钱涛, 詹雅婷, 李胤, 宋珂, 邵明超, 虞钟直, 程涛, 姚霞, 郑恒彪, 朱艳, 曹卫星, 江冲亚
农业大数据学报    2025, 7 (2): 161-172.   DOI: 10.19788/j.issn.2096-6369.000098
摘要202)   HTML7)    PDF(pc) (3682KB)(88)    收藏

旨在探讨基于车载相机和HLS时序遥感数据相结合的作物分类方法,以提高作物分类的效率和精度,解决传统方法中地面样本采集效率低、遥感物候特征利用不充分等问题。研究以江苏省秋粮分类为例,验证了此方法的可行性和应用潜力。通过车载相机采集道路两侧作物图像并构建大量人工标注样本,结合2023年和2024年的HLS时序数据,采用高斯滤波重构时间连续的地表反射率,提取多维特征,构建随机森林分类模型。研究结果表明,水稻、玉米和大豆在HLS时序数据中表现出较为明显的差异。水稻的分类精度最高,生产者精度与用户精度均超过90%,而玉米和大豆因物候特征的相似性,精度相对较低(74%-85%)。模型在独立验证县的总体分类精度为89%,验证县内的水稻主要分布于全县东南区域,玉米和大豆则集中于西北区域,且分布特征清晰。车载相机结合HLS时序数据可实现高效的作物分类,随机森林模型对高维特征整合与抗样本不平衡性具有显著优势。尽管模型总体表现优良,但在破碎地块和高云量区域仍有改进空间。未来需融合多源遥感数据缓解云干扰,并扩展作物类型以增强模型泛化能力。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
19. 迈向数智农业:场景、数据与智能
周国民
农业大数据学报    2025, 7 (2): 141-143.   DOI: 10.19788/j.issn.2096-6369.200007
摘要194)   HTML29)    PDF(pc) (228KB)(192)    收藏
参考文献 | 相关文章 | 多维度评价 | 评论0
20. 农业科学数据在线分析挖掘平台设计与应用
李佳乐, 林佳, 贺子康, 王健, 张建华, 周国民
农业大数据学报    2025, 7 (2): 183-192.   DOI: 10.19788/j.issn.2096-6369.000045
摘要192)   HTML17)    PDF(pc) (2679KB)(78)    收藏

随着数据驱动科学研究范式的发展,农业科学数据在科技创新中的作用越来越突出,随之而来的是农业科学数据分析挖掘和应用方法与技术研究也不断发展。围绕农业科学数据分析挖掘存在数据语义孤岛严重,以及数据挖掘工具不全、不配套与场景适应性差等突出问题。本文设计了平台架构,构建了分析挖掘引擎,加载了典型和专业分析挖掘算子工具,形成了农业科学数据在线分析挖掘平台,包括数据层、领域数据分析工具层、自动化挖掘框架层、在线分析引擎,以及用户界面层5个层次,开发了数据管理、组件管理、场景管理、挖掘分析4大功能模块。平台具备应用场景管理、在线分析、自动化挖掘等功能,突破“数据资源—分析工具—应用场景”衔接不畅的问题,形成集数据资源、分析模型、组件工具、场景分析和标准流程于一体的在线分析挖掘应用环境,支撑从“数据聚合—挖掘分析链—在线分析—场景应用”的农业科学数据在线分析挖掘全过程,实现超大规模数据及不同场景分析应用的并发在线交互计算分析。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
21. 基于云-边-端构建高含沙灌区雷达测流智慧服务平台
韩芙蓉, 郝星耀, 李晶晶, 郑文刚, 林萍, 郭瑞
农业大数据学报    2025, 7 (3): 320-330.   DOI: 10.19788/j.issn.2096-6369.000104
摘要184)   HTML16)    PDF(pc) (3294KB)(141)    收藏

探讨了高含沙灌区雷达测流智慧服务平台的构建和应用,设计并搭建了基于云-边-端的智慧服务平台,实现了灌区信息化和高效化管理。在架构中,终端设备负责在灌区现场实时采集水位、流量、流速等关键水情数据;边缘计算节点靠近数据源,实时分析和传输数据,有效降低传输延迟和带宽消耗;云端则集中处理边端和终端数据,提供数据存储、深入分析及可视化等服务功能。平台在新疆维吾尔自治区沙湾市安集海镇的巴音沟河灌区进行了实际应用,展示了本平台在水情数据采集、传输、处理以及分析等方面的有效性,为高含沙灌区的水情监测、水资源合理调配、防洪减灾等方面提供了有力的技术支撑,对推动高含沙灌区水利信息化发展具有重要意义。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
22. 2024年浙江省景宁畲族自治县望东垟、毛垟乡昆虫快速普查数据集
徐志忠, 吴耀成, 熊小倩, 张衢华, 柳飞杨, 余惠玲
农业大数据学报    2025, 7 (3): 393-399.   DOI: 10.19788/j.issn.2096-6369.100050
摘要173)   HTML4)    PDF(pc) (1930KB)(64)    收藏

本文呈现了基于在浙江省丽水市景宁畲族自治县进行的一次昆虫快速调查所获得的昆虫物种数据集。在为期3天的调查中,共获得443条物种记录,涵盖15目昆虫。采集到的昆虫照片经晓虫AI鉴定,鉴定结果和可信度均在数据集中有所记录。基于这一数据集,我们提出了结合快速调查、拍照和AI鉴定技术的方法,以实现区域性昆虫多样性众包数据采集。并探讨了利用公众参与和AI技术降低昆虫多样性调查成本的可能性,以及数据众包在生物多样性调查与保护工作中的重要性。

数据摘要:

项目 描述
数据库(集)名称 2024年浙江省景宁畲族自治县望东垟、毛垟乡昆虫快速普查数据集
所属学科 农业科学
研究主题 昆虫多样性
数据时间范围 2024年5月-6月
数据地理空间覆盖 浙江省景宁畲族自治县望东垟乡、毛垟乡
数据类型与技术格式 .docx,.jpg,.xlsx
数据库(集)组成 本数据集包括一个数据说明文件,以及气象数据、物种列表与物种图片。
气象数据包含调查期间日均气象和小时气象记录共两个xls文件。物种数据包含1个清单文件,和按照目分列的物种图片数据共15个文件夹。其中图片文件共442个。
数据量 4.52 GB
主要数据指标 拍摄时间地点、物种分类信息、AI识别准确率、温湿度、气压、风向、负氧离子
数据可用性 CSTR:17058.11.sciencedb.agriculture.00173; https://cstr.cn/17058.11.sciencedb.agriculture.00173
Doi:10.57760/sciencedb.agriculture.0017; https://doi.org/10.57760/sciencedb.agriculture.00173
经费支持 景宁畲族自治县科技计划项目:景宁毛垟乡望东垟高山湿地自然保护区森林康养(2023C27).
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
23. 2023年海南近岸海域浮游植物群落组成和物种多样性调查数据集
刘思航, 费小雯, 闫佳, 邓晓东
农业大数据学报    2025, 7 (3): 410-420.   DOI: 10.19788/j.issn.2096-6369.100033
摘要172)   HTML9)    PDF(pc) (3240KB)(93)    收藏

海南省四面环海,其周边海域生态环境质量已成为制约社会经济可持续发展的重要因素。本数据集源于农业农村部财政专项项目“南锋专项”Ⅲ期在2023年8月所开展的对于海南周边海域浮游植物群落组成和物种多样性调查的结果。本数据集旨在调查海南周边海域浮游植物群落组成和物种多样性,以此评价水域水质情况,为海南省周边海域的水质监测以及水域环境防治提供数据支持,对相关海域的环境与生物多样性研究具有参考价值。数据集中数据调查样地选择为海南省临高黄龙港、东方八所港、万宁石梅湾、文昌新埠海四片海域,采用浅水Ⅲ型浮游生物网采集水样,使用便携式相关指标水质检测仪器进行现场测定各调查站位的气温、水温、pH值、电导率、盐度、溶解氧(COD),样品采用光学显微镜CX41进行全片观察,采用 Shannon-Wiener 多样性指数(H′)、Pielou 均匀度指数(J)、优势度(Y)和丰富度指数(d)等数据处理分析方法评价水域水质。本次调查采集微藻及海水样品36份,对样品进行水质检测以及显微镜观察分析。调查结果如下:通过镜检四处海域采样样本鉴定浮游植物种类合计253种,其中硅藻214种,甲藻24种,蓝藻15种,硅藻门物种占总种类数的84.48%,石梅湾样地浮游植物物种最为丰富,新埠样地海浮游植物物种数最少;八所港、石梅湾样地多样性指数均大于3,其中石梅湾多样性指数最高,黄龙港海域的多样性指数小于1;四个样地海湾海域均匀度指数均小于1,其中石梅湾最高为0.81;经水质检测后发现石梅湾的COD、氨氮、总氮、总磷、亚硝酸盐氮为四处海域最低,黄龙港各项水质指标则均要高于其余三处,且黄龙港小环藻属的密度占比已达92.32%。该数据集可用于监测海南周边近岸海域浮游植物种群、密度、优势种等,并为相关部门预防赤潮、水华等自然灾害提供数据支持。

数据摘要:

项目 描述
数据库(集)名称 2023年海南近岸海域浮游植物群落组成和物种多样性调查数据集
所属学科 生态学、农业科学
研究主题 浮游植物群落组成和物种多样性
数据时间范围 2023年8月
数据地理空间覆盖 海南省周边海域
空间分辨率 海南省;临高市;东方市;万宁市;文昌市
数据类型与技术格式 .xlsx
数据库(集)组成 东方市海域浮游植物数据统计(2023 东方海域浮游植物数据统计.xlsx);临高市海域浮游植物数据统计(2023 临高海域浮游植物数据统计.xlsx);万宁市海域浮游植物数据统计(2023 万宁海域浮游植物数据统计.xlsx);文昌市海域浮游植物数据统计(2023 文昌海域浮游植物数据统计.xlsx);水质检测数据(2023水质数据测定.xlsx)
数据量 375 KB
主要数据指标 浮游植物的物种数及密度
数据可用性
CSTR:17058.11.sciencedb.agriculture.00005; https://cstr.cn/17058.11.sciencedb.agriculture.00005
DOI:10.57760/sciencedb.agriculture.00005; https://doi.org/10.57760/sciencedb.agriculture.00005
经费支持
国家自然科学基金(82260669);海南省自然科学基金项目(322RC766);海南省重点研发计划(ZDYF2022SHFZ314);农业农村部财政专项(NFZX2021);中国热带农业科学院公益项目(1630052019012)。
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
24. 2023年新疆塔城地区草地类型Landsat8影像训练数据集
杨延晓, 李全胜, 胡林, 张鲜花, 孙伟
农业大数据学报    2025, 7 (2): 255-260.   DOI: 10.19788/j.issn.2096-6369.100052
摘要161)   HTML5)    PDF(pc) (2341KB)(105)    收藏

草地资源是畜牧业生产的物质基础和生物多样性的基因库,具有防风固沙、涵养水源的生态功能,草地资源调查及监测意义重大。基于卫星遥感的草地分类不仅能够为草地资源调查提供数据支持,也可为草地物种多样性研究提供依据。基于野外调查数据获取真实样地草地类型信息,利用辐射定标、大气校正、图像融合等预处理后的Landsat8遥感影像,通过目视解译遥感判读的方式,使用ArcGIS软件构建了塔城地区8类草地类型共3360张多光谱遥感图像分类训练数据集。本数据集可为塔城地区草地类型遥感图像分类研究提供数据基础,同时可为其他地区相关领域的科研人员提供数据参考。

数据摘要:

项目 描述
数据库(集)名称 2023年新疆塔城地区草地类型Landsat8影像训练数据集
所属学科 农业科学
研究主题 草地类型
数据时间范围 2023年
数据地理空间覆盖 新疆塔城地区,82°16'-87°21′E,43˚25΄-47°15′′N,包括:额敏县、托里县、裕民县、和布克赛尔蒙古自治县、塔城市、沙湾市、乌苏市。
空间分辨率 15 m
数据类型与技术格式 .tif
数据库(集)组成 数据集共包含8个以草地类命名的文件夹,每个文件夹中包含相应草地类型的遥感影像,共3360幅。
数据量 5.74 GB
主要数据指标 低地草甸,温性草原化荒漠,温性草甸草原,温性荒漠草原,山地草甸,温性草原,高寒草甸,温性荒漠
数据可用性 CSTR:17058.11.sciencedb.agriculture.00135; https://cstr.cn/17058.11.sciencedb.agriculture.00135
DOI:10.57760/sciencedb.agriculture.00135; https://doi.org/10.57760/sciencedb.agriculture.00135
经费支持 国家自然科学基金项目(32271880,32060321)
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
25. 开放科学背景下数据馆员处理个人信息的挑战、规范与安全管理体系研究
顾立平, 张广寅, 万益嘉
农业大数据学报    2025, 7 (3): 357-370.   DOI: 10.19788/j.issn.2096-6369.000077
摘要161)   HTML4)    PDF(pc) (484KB)(125)    收藏

在开放科学深化科研数据管理实践的背景下,数据馆员处理个人信息需应对法律、伦理与实践挑战以平衡开放与保护,本研究旨在提供相应规范与策略。本研究首先系统梳理了个人信息保护相关的法律法规体系及相关核心概念,探讨了科研活动中独特的伦理考量与实践特殊性。随后,深入分析了数据馆员在个人信息获取、组织、共享与发布等关键环节中应遵循的操作规范、面临的主要风险与实践挑战。在此基础上,参照相关法律要求与标准,提出了一个涵盖组织、人员、物理和技术四个维度的、面向数据馆员的个人信息综合安全管理体系框架。研究发现,数据馆员在实践中面临多重困境:将法律原则应用于复杂科研场景时的操作难点;满足高于法律底线的伦理要求;调和开放科学与个人信息保护之间的内在矛盾。研究强调个人信息风险贯穿数据全生命周期,并呈现显著的学科差异性,凸显了构建系统化、多维度综合安全管理体系的必要性与紧迫性。本研究为数据馆员处理个人信息提供了清晰的法律边界、伦理指引和风险识别框架。提出的综合安全管理体系可作为实践参考,有助于提升数据馆员及所在机构的个人信息保护能力与合规水平,从而在保障数据主体权益的基础上,推动负责任、可持续的开放科学发展。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
26. 大数据促进农业生产效率的机制与效应研究——基于国家大数据综合试验区试点政策的准自然实验
苗金芳, 马明瑞, 罗军林
农业大数据学报    2025, 7 (3): 331-342.   DOI: 10.19788/j.issn.2096-6369.000079
摘要157)   HTML5)    PDF(pc) (519KB)(95)    收藏

本文使用全国285个地级市2011至2020年的面板数据,将国家级大数据综合试验区政策作为准自然实验,运用广义双重差分模型、中介效应模型、空间杜宾模型,实证分析了大数据综合试验区建设对地区农业生产效率的影响。研究结果显示:(1)大数据综合试验区试点的设立显著提升了地区农业人均产值,有效提高其生产效率。(2)中介效应机制分析表明,国家级大数据试验区可以通过支持数字技术在农业领域的研发和应用,推进产业数字化,提高农业生产效率。(3)大数据综合试验区政策对农业生产效率具有负向空间交互效应,即大数据试验区的设立对周边地区农业发展具有虹吸效应。本研究为大数据综合试验区建设对地区农业发展的影响提供了重要的经验证据,可为数字经济扶农助农相关政策的制定提供参考。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
27. 基于Docker与Kubernetes技术的渠灌区高效用水管控平台的设计与应用
张石锐, 李腾, 林萍, 刘伟, 魏一博
农业大数据学报    2025, 7 (3): 307-319.   DOI: 10.19788/j.issn.2096-6369.000107
摘要153)   HTML7)    PDF(pc) (2750KB)(34)    收藏

灌溉方式落后,用水管理不规范,节水意识薄弱等问题造成我国农田灌溉水利用系数较发达国家差距明显,急需采用信息化技术赋能发展精细化渠灌区灌溉信息化、智能化管控。本研究采用基于Docker与Kubernetes的微服务框架,解决了不同开发语言和不同运行环境的物联网系统、灌溉决策用水调度算法、Web服务等关键服务模块的集成应用问题,围绕渠灌区农田“水情监测-智能决策-高效调控”等关键环节,构建渠灌区高效用水管控平台。文中介绍了平台的业务逻辑、平台架构、功能实现方法等技术环节。在黑龙江和平灌区的应用效果表明,平台降低了水情监测和灌溉用水的人力投入60%,提高了农田灌溉水有效利用系数19%,打造了渠灌区信息化灌溉管控的可应用、可复制、可推广样板工程。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
28. 2023年安徽省蚌埠市农产品加工企业情况调查数据集
夏张
农业大数据学报    2025, 7 (2): 269-275.   DOI: 10.19788/j.issn.2096-6369.100046
摘要151)   HTML5)    PDF(pc) (437KB)(93)    收藏

安徽省蚌埠市地处淮河中游,农业发展优势明显。近年来,蚌埠市市委、市政府高度重视农业产业化发展,扎实推进“农头工尾”增值工作,打造出一批蚌埠市绿色食品品牌。作者对2023年蚌埠市农业企业,特别以农产品加工业为重点,进行了调研。调研指标涉及企业名称、企业类型、利润率、2023年营业收入、2023年研发费用、2023年宣传费用、产品质量体系标准、企业中本科以上人员占比、普通员工平均月薪、企业发展中存在的问题等,调研结果形成安徽省蚌埠市农产品加工企业情况调查数据集。本文提供的2023年蚌埠市农业生产和加工相关数据,可为地方政策制定提供参考。

数据摘要:

项目 描述
数据集名称 2023年安徽省蚌埠市农产品加工企业情况调查数据集
所属学科 农产品加工
研究主题 蚌埠市农产品加工企业
数据时间范围 2023年
数据地理空间覆盖 安徽省蚌埠市
数据类型与技术格式 .xlsx
数据库(集)组成 本数据集由两部分组成:(1)84个样本企业负责人数据集:包含性别信息、年龄信息、受教育水平信息;(2)84个样本企业数据集:包含企业利润率和研发费用占比信息。
数据量 77.51 kB
主要数据指标 年龄、受教育水平、利润率、研发费用占比
数据可用性 CSTR: 17058.11.sciencedb.agriculture.00145; https://cstr.cn/17058.11.sciencedb.agriculture.00145
DOI: 10.57760/sciencedb.agriculture.00145; https://doi.org/10.57760/sciencedb.agriculture.00145
经费支持 蚌埠市社科联一般项目
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
29. 我国数字乡村服务站建设的调查与思考
王治文, 石智峰, 赵虎, 张翼, 宋海燕
农业大数据学报    2025, 7 (3): 353-356.   DOI: 10.19788/j.issn.2096-6369.200006
摘要150)   HTML8)    PDF(pc) (333KB)(35)    收藏

数字乡村服务站在提升乡村人口数字服务和推动农业增效、农民增收、农村增活力方面发挥了重要作用。本文基于对北京、河北、山东、重庆、四川等地的实地调研,总结分析了乡村便民服务的需求现状及存在的问题。研究表明,当前乡村便民服务需求多样且复杂,主要包括产业服务、金融服务、政务服务和综合服务,服务站建设运行中存在选址布局不合理、服务内容有限、环境人员参差不齐、数据融合应用不够等问题。本文从应对服务多样化、个性化和可持续角度出发,针对选址布局、服务内容、运营机制、人员保障、资金保障和数据共享等提出了政策建议。

参考文献 | 相关文章 | 多维度评价 | 评论0
30. 基于区块链的优质作物种质资源数据存储模型研究
苏楠, 王青梅, 司海平, 李艳玲, Fernando Bacao
农业大数据学报    2025, 7 (3): 343-352.   DOI: 10.19788/j.issn.2096-6369.000099
摘要150)   HTML4)    PDF(pc) (2492KB)(87)    收藏

为集中整合优质作物种质资源,降低中心化数据存储压力,保障优质作物种质数据安全性,加大优质作物种质资源保护与利用力度,针对当前鲜有研究优质作物种质资源数据存储问题的现状,构建“区块链+IPFS”的链上链下协同存储模型。通过降低链上存储压力,搭建IPFS(星际文件系统)节点,将具体种质数据存储在IPFS中,将IPFS返回的Hash值以及种质摘要信息存入区块链,解决区块链无法承担冗余数据量的问题,设计了作物发布、添加和查询的智能合约,并调用智能合约完成对数据的操作。从存储空间、存储时间两方面对模型进行了存储性能测试。实验表明该模型降低了本地存储空间的存储压力;存储时间虽略有延迟,但在可接受范围内。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
31. 2024年鸡主要疫病流行动态数据集
马秀丽, 刘存霞, 徐怀英, 郭效珍, 刘丽萍, 高月花, 朱彤, 鞠艳, 于可响, 胡峰, 吕俊峰, 赵巧雅, 黄兵, 李玉峰, 秦卓明, 刘小群
农业大数据学报    2025, 7 (4): 519-531.   DOI: 10.19788/j.issn.2096-6369.100061
摘要140)   HTML43)    PDF(pc) (529KB)(49)    收藏

近年来,规模化养禽业的持续发展带来了新的挑战,特别是在疫苗免疫的压力下,H9N2亚型禽流感、鸡传染性支气管炎等主要鸡病的病原发生了不同程度的变异。为了了解病害流行状况,积累数据,分析鸡病流行趋势,本研究收集了来自山东、河南等全国15个省市自治区的2135份临床疑似病例样本,构成数据集。并通过PCR检测技术,结合疑似病例的临床症状与病理剖检变化,对2024年送检的疑似病例进行了全面的实验室诊断。随后,针对那些危害严重的病原体,选取了关键基因进行测序分析。本数据集可用于鸡主要病毒病的分析、预测,为未来疫病防控工作提供了基础数据。

数据摘要:

项目 描述
数据集名称 2024年鸡主要疫病流行动态数据集
所属学科 兽医学
研究主题 鸡的主要疫病
数据时间范围 2024年
数据地理空间覆盖 山东、河南、河北、江苏、辽宁、广东、广西、云南、湖南、湖北,安徽、辽宁、甘肃、黑龙江、内蒙古自治区
数据类型及技术格式 .xlsx,.pdf
数据集组成 数据集由1个表格和1个pdf文件组成,其中表格为2 135份鸡主要疫病检测数据;文件为相关数据分析。
数据量 404.56 KB
主要数据指标 病原;阳性率;基因型
数据可用性 CSTR:17058.11.sciencedb.agriculture.00245; https://cstr.cn/17058.11.sciencedb.agriculture.00245
DOI:10.57760/sciencedb.agriculture.00245; https://doi.org/10.57760/sciencedb.agriculture.00245
经费支持 山东省重点研发计划(2022CXGC010606,2024CXGC010910,2022CXPT010-04,2025CXGC010803);2024年山东省农业重大技术协同推广计划(SDNYXTTG-2024-09);山东省家禽产业技术体系首席专家项目(SDAIT-11-01);山东省农业科学院农业科技创新工程基础研究任务(GXGC2024D11,CXGC2020C11)。
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
32. 基于大模型的水稻育种领域知识发现与应用研究
李娇, 鲜国建, 黄永文, 罗婷婷, 孙坦, 马玮璐
农业大数据学报    2025, 7 (4): 421-430.   DOI: 10.19788/j.issn.2096-6369.000123
摘要131)   HTML15)    PDF(pc) (1989KB)(63)    收藏

作为国家种源安全战略的核心载体,水稻育种领域的知识发现研究具有重要价值,生物技术和信息技术的快速发展驱动该领域研究成果爆发式增长,破解学术资源过载导致的知识发现难题,可满足科研人员精准化、智能化的科研创新知识服务需求。本文提出基于大模型的水稻育种领域知识发现框架,设计从数据采集与预处理到细粒度知识抽取与融合、领域智能知识发现的技术路径,基于PMC、Web of Science、CrossRef和DataCite构建高质量科技文献数据集验证架构有效性。研究围绕优质、高效、高产、绿色、多抗等水稻育种目标构建了包含领域实体、科技资源实体、引文关系的知识资源底座,结合农知大模型实现基于引文网络和领域知识结构的多粒度知识发现。本研究将大模型的语义理解能力与领域知识组织体系的逻辑约束深度融合,数智赋能的“数据-知识-服务”技术路径可有效实现隐性知识显性化和碎片知识系统化,推动学术资源高效利用和创新发现,并为农业多领域智能知识发现提供迁移框架。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
33. 2024−2025年北京温室种植蔬菜作物空气和土壤温湿度数据集
张石锐, 贾宇轩, 李友丽, 郭园园, 曲明山, 张馨
农业大数据学报    2025, 7 (4): 543-550.   DOI: 10.19788/j.issn.2096-6369.100067
摘要131)   HTML16)    PDF(pc) (2401KB)(43)    收藏

温室蔬菜产业是北京都市现代农业中重要的种植业之一,是京郊农民增收的重要来源。东西垄种植减少了垄的数量,有利于智能水肥决策 方法和智能农机装备的应用,是提高温室生产效率的重要手段,然而,用于东西垄种植温室环境研究的数据还较少。2024年5月1日至2025年7月3日期间对北京市小汤山国家精准农业研究示范基地中采用东西垄种植的日光温室中的作物生长环境进行了监测。本数据集包含两季番茄-番茄-黄瓜-快菜4茬温室作物生长环境监测数据,数据包含生育期、空气温度、空气湿度、20cm土壤水分、40 cm土壤水分、60 cm土壤水分、20 cm土壤温度、40 cm土壤温度、60 cm土壤温度。其中空气温湿度数据采集间隔为5 min,土壤墒情数据采集间隔为15 min,数据量为4.59 MB,数据采用xlsx存储。该数据可用于分析不同作物类型下,东西垄温室的环境变化规律,从而制定合理的灌溉计划,构建智能灌溉决策模型。

数据摘要:

项目 描述
数据库(集)名称 2024-2025年北京温室种植蔬菜作物空气和土壤温湿度数据集
所属学科 农业科学
研究主题 温室蔬菜种植
数据时间范围 2024年5月1日-2025年7月3日
时间分辨率 温室空气温湿度数据:5分钟,温室土壤温湿度数据:15分钟
数据类型与技术格式 .xlsx
数据库(集)组成 数据由四个表格文件组成,包含温室春茬番茄种植监测数据表、温室秋茬番茄种植监测数据表、温室黄瓜种植监测数据表和温室快菜种植监测数据表。
数据量 4.59 MB
主要数据指标 生育期、空气温度、空气湿度、20 cm土壤水分、40 cm土壤水分、60 cm土壤水分、20 cm土壤温度、40 cm土壤温度、60 cm土壤温度
数据可用性 CSTR:17058.11.sciencedb.agriculture.00283; https://cstr.cn/17058.11.sciencedb.agriculture.00283
DOI:10.57760/sciencedb.agriculture.00283; https://doi.org/10.57760/sciencedb.agriculture.00283
经费支持 北京市农林科学院改革与发展项目感算融合的土壤墒情监测技术研究与智能传感器研发(GGFZ20240116)。
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
34. 农业农村数据融合服务平台的设计与应用实践
哈晓琳, 李杰, 原育慧, 张子怡, 梁敏燕
农业大数据学报    2025, 7 (4): 468-484.   DOI: 10.19788/j.issn.2096-6369.000130
摘要123)   HTML15)    PDF(pc) (2534KB)(35)    收藏

随着数字乡村战略的深入推进,农业农村领域对数据资源的集成共享、业务协同和智能服务提出了更高要求。本文针对农业农村数据资源汇聚与服务需求,提出了一种基于Hadoop的农业农村数据融合服务平台设计方案,创新性地构建了一种“云—边—端”+集中管理区的混合部署平台模型及其关键技术方案。平台依托“区块链+隐私计算”等先进的隐私保护与数据安全技术,打造支撑农业农村数据要素价值实现的技术基础,面向农业农村数据要素价值化需求,提供覆盖数据采集、治理、融合、应用全生命周期的管理能力与融通服务。平台目前已汇聚超过30个类别的农业农村数据,总量约500GB,涵盖生产、管理、服务等多个维度。围绕平台架构、部署架构、关键技术及应用场景展开研究,搭建农业农村现代化的数据融合服务平台,探索解决农业数据权属清晰、价值认定明确、交易过程可信的难点问题。利用大数据技术体系,促进涉农数据要素的流通共享、价值深度挖掘与资产高效转化。在典型查询场景下,平台实现了多维度数据检索平均响应延迟低于100毫秒的性能表现。平台能够显著提升交易过程的数据安全性与全链路可追溯性,有效解决海量农业农村数据在性能、容量与多用途支持上的不足问题,同时为跨部门政务协同与数据共享提供标准化范式,加速农业农村数据要素市场培育,赋能乡村数字经济高质量发展。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
35. 2024年河南省农村教育投入与消费偏好调查统计数据集
代佳敏, 艾丽菲热·吾甫尔, 张虹
农业大数据学报    2025, 7 (4): 551-560.   DOI: 10.19788/j.issn.2096-6369.100069
摘要112)   HTML7)    PDF(pc) (785KB)(44)    收藏

教育支出日益成为农村家庭消费结构中的重要组成部分,其后蕴含着家庭对人力资本投资的策略选择与消费观念的转变。为深入了解农村居民在教育投入与消费偏好方面的真实状况,研究团队于2024年6-7月在河南省5个县15个乡镇开展了大规模入户问卷调查,形成了2024年河南省农村教育投入与消费偏好调查统计数据集。该问卷涵盖了家庭人口与收入信息、教育支出结构、线上教育使用情况、教育观念与焦虑感知等多个维度,共回收问卷3 169份,经缺失值与逻辑一致性审查后剔除67份,最终保留有效样本3 102份。问卷设计结合专家访谈与文献调研,数据采集过程中采用实地入户访问与随机抽样相结合,并通过双录入校验、异常值剔除和逻辑一致性审查等方式严格控制质量。与以往侧重宏观统计的研究不同,本数据集在微观层面揭示了农村家庭教育支出行为、消费偏好选择及教育焦虑特征,为实证检验“教育支出挤出效应”、探讨线上教育对教育公平的作用机制、分析不同收入群体的消费差异提供了坚实的数据支撑。同时,该数据集也为教育资源精准配置、农村家庭教育负担评估及数字教育产品推广提供了实践参考。

数据摘要:

项目 描述
数据集名称 2024年河南省农村教育投入与消费偏好调查统计数据集
所属学科 农业经济管理,农业社会学
研究主题 农村教育支出行为与家庭消费偏好结构
数据时间范围 2024年6月至7月
数据地理空间覆盖 中国河南省中牟县、延津县、商水县、卢氏县、淮滨县下辖15个乡镇
数据类型与格式 .xlsx
数据库(集)组成 数据集包含1个原始主数据文件及多个处理衍生文件,覆盖3102户农村家庭的结构化问卷数据,变量数超过150项。
数据量 462.29 KB
主要数据指标 家庭人口信息,年收入结构,教育支出构成与阶段分布,线上教育使用频率与支出水平,教育观念与焦虑评分,消费偏好排序,政策认知等。
数据可用性 CSTR:17058.11.sciencedb.agriculture.00287; https://cstr.cn/17058.11.sciencedb.agriculture.00287
DOI:10.57760/sciencedb.agriculture.00287; https://doi.org/10.57760/sciencedb.agriculture.00287
图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
36. 多模态数据融合驱动的野外牧场虚拟电子围栏牲畜在栏判断模型
李世杰, 孔繁涛, 曹姗姗, 孙伟
农业大数据学报    2025, 7 (4): 446-457.   DOI: 10.19788/j.issn.2096-6369.000115
摘要111)   HTML5)    PDF(pc) (1664KB)(28)    收藏

传统的野外牧场布设的铁丝网等物理围栏不利于牲畜转场、野生动物迁徙和草原生态连通性,现有虚拟电子围栏多借助于电子地图和牲畜个体佩戴的接触式智能项圈定位,动物应激反应大、设备易脱落且数据维护成本高。融合放牧机器人采集的双目立体视觉、GPS定位和IMU三类传感器数据,构建多模态数据融合驱动的牲畜位置感知与在栏判断模型。以野外牧场自然放牧状态下的牛只为研究对象,基于高德地图API构建牧场虚拟电子围栏边界数据;采用YOLOv8s模型提取基于双目立体图像的牛只个体目标信息,利用双目立体图像的深度信息解析识别的牛只目标与放牧机器人之间的空间距离信息,进而融合放牧机器人GPS绝对定位数据和IMU位姿数据,采用扩展卡尔曼滤波算法进行牛只空间位置的地理空间坐标映射,解算机器视野下牛只定位的经纬度坐标数据;引入顶点微调策略和缓冲区预警机制,采用改进的射线法(Pnpoly算法)获取虚拟电子围栏的牛只在栏判断数据。连续采集200条牛只移动轨迹数据,在凸多边形、凹多边形与不规则边界的虚拟电子围栏场景下进行数据融合、解析与获取的实验验证,在栏判断准确率97.8%,较传统算法提升4.3%。结果表明,基于机器视觉与传感器融合的多模态数据驱动方法在野外牧场环境下具备较强适应性和工程应用价值,可为牲畜管理提供非接触式、高精度、持续稳定的虚拟电子围栏空间管理数据。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
37. 基于图数据库的农业多本体解析导入方法
陈晓静, 李威, 樊景超, 闫燊, 张建华, 周国民
农业大数据学报    2025, 7 (4): 431-445.   DOI: 10.19788/j.issn.2096-6369.000125
摘要104)   HTML14)    PDF(pc) (5077KB)(45)    收藏

统一组织结构复杂、规模庞大的农业本体,对于消除平台之间的数据孤岛、优化农业知识的标准化表达以及提高信息检索效率具有重要意义。本研究利用图数据库在存储本体方面的天然结构优势,创新性提出一种将面向OBO和OWL两种格式的大规模农业本体数据导入图数据库的方法。该方法首先按语义信息拆分解析OBO本体,同时通过消除冗余概念和前缀资源解析OWL本体,其次,在减少存储压力的需求下,进一步设计了编码方案和基于共现次数的属性关系筛选,最后智能化建模和映射,将本体存储进图数据库中,完成具备167 887个实体和249 603条关系的农业多本体数据库的构建。实体和关系对比分析结果表明,该方法在保留本体内部结构的同时,也保留了广泛的本体间知识链接,案例分析结果证明,多本体解析融合机制可以直观有效地构建跨本体知识交互。该方法有助于进一步推动农业本体的重用和共享,有效提升了农业信息资源标准化程度,所构建的农业多本体集成知识库为农业语义搜索、知识深度挖掘和智能化农业管理决策奠定了坚实的数据基础。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
38. 科学数据视角下AlphaFold的迭代突破与数据策略启示
欧阳峥峥, 马毓聪, 寇远涛, 鲜国建, 王辉, 赵群
农业大数据学报    2025, 7 (4): 485-495.   DOI: 10.19788/j.issn.2096-6369.000136
摘要102)   HTML3)    PDF(pc) (450KB)(32)    收藏

AlphaFold系列模型在结构生物学领域的革命性突破常被归因于算法创新,但其背后更为根本的科学数据策略演进却鲜有系统性剖析。本文从科学数据的核心视角出发,系统解构AlphaFold 1至3代的迭代突破机制,聚焦数据内在属性优化、表征范式革新、数据-模型协同适配三大关键层面,论证模型每一次性能跃升的本质均是数据-模型协同进化的结果。研究揭示:AlphaFold的演进是其数据策略从被动沿用、主动构建到生成赋能的历程。基于此,本文提炼出三大核心规律:表征范式的跃迁是突破的核心驱动,数据-模型的协同演进是成熟的关键标志,而数据内在属性的丰富度则决定了AI学习范式的上限。这些规律为AI for Science(AI4S)领域带来四大关键启示:数据工作需从被动准备转向主动设计;研发应从“模型/数据中心”转向以“契合度”为中心;数据体系构建应靶向提升核心属性而非盲目多模态聚合;业界亟待构建一套衡量数据“科学效能”的全新理论与评估框架,为AI驱动的科学发现提供理论支撑与路径参考。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
39. 农业科学数据在线分析引擎设计与应用
李佳乐, 贺子康, 姚琼, 赵晓燕, 周国民, 张建华
农业大数据学报    2025, 7 (4): 458-467.   DOI: 10.19788/j.issn.2096-6369.000131
摘要96)   HTML7)    PDF(pc) (2030KB)(33)    收藏

针对农业大数据时代数据富集、知识转化难、现有工具数据壁垒高、语义缺失、灵活性不足的问题,本研究设计并开发了农业科学数据在线分析引擎。该引擎采用分层架构,包含用户交互层、智能工作流引擎、知识库与状态管理模块、容器化执行层,核心创新在于:构建数据状态描述符与算子能力画像的元数据驱动机制,提出SC-MPARank混合推荐模型,设计领域语义导向的动态可进化流水线。引擎通过知识图谱实现“持续学习-实时推理”,兼具通用平台灵活性、专家系统专业性与AutoML自动化能力,可智能组织执行现有算法。现已实际应用于育种、耕地、农业绿色发展三大场景,有效降低技术门槛,提升数据到决策的转化效率与可靠性,为智慧农业提供了实用的农业科学数据分析工具。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
40. 基于PSA-YOLO11n的小麦害虫检测
康继昌, 赵连军
农业大数据学报   
录用日期: 2025-04-21