当期目录

    2025年 第7卷 第4期 刊出日期:2025-12-26
    数据智能
    基于大模型的水稻育种领域知识发现与应用研究
    李娇, 鲜国建, 黄永文, 罗婷婷, 孙坦, 马玮璐
    2025, 7(4):  421-430.  DOI: 10.19788/j.issn.2096-6369.000123
    摘要 ( 18 )   HTML ( 4)   PDF (1989KB) ( 14 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    作为国家种源安全战略的核心载体,水稻育种领域的知识发现研究具有重要价值,生物技术和信息技术的快速发展驱动该领域研究成果爆发式增长,破解学术资源过载导致的知识发现难题,可满足科研人员精准化、智能化的科研创新知识服务需求。本文提出基于大模型的水稻育种领域知识发现框架,设计从数据采集与预处理到细粒度知识抽取与融合、领域智能知识发现的技术路径,基于PMC、Web of Science、CrossRef和DataCite构建高质量科技文献数据集验证架构有效性。研究围绕优质、高效、高产、绿色、多抗等水稻育种目标构建了包含领域实体、科技资源实体、引文关系的知识资源底座,结合农知大模型实现基于引文网络和领域知识结构的多粒度知识发现。本研究将大模型的语义理解能力与领域知识组织体系的逻辑约束深度融合,数智赋能的“数据-知识-服务”技术路径可有效实现隐性知识显性化和碎片知识系统化,推动学术资源高效利用和创新发现,并为农业多领域智能知识发现提供迁移框架。

    数据处理与分析
    基于图数据库的农业多本体解析导入方法
    陈晓静, 李威, 樊景超, 闫燊, 张建华, 周国民
    2025, 7(4):  431-445.  DOI: 10.19788/j.issn.2096-6369.000125
    摘要 ( 26 )   HTML ( 4)   PDF (5077KB) ( 9 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    统一组织结构复杂、规模庞大的农业本体,对于消除平台之间的数据孤岛、优化农业知识的标准化表达以及提高信息检索效率具有重要意义。本研究利用图数据库在存储本体方面的天然结构优势,创新性提出一种将面向OBO和OWL两种格式的大规模农业本体数据导入图数据库的方法。该方法首先按语义信息拆分解析OBO本体,同时通过消除冗余概念和前缀资源解析OWL本体,其次,在减少存储压力的需求下,进一步设计了编码方案和基于共现次数的属性关系筛选,最后智能化建模和映射,将本体存储进图数据库中,完成具备167 887个实体和249 603条关系的农业多本体数据库的构建。实体和关系对比分析结果表明,该方法在保留本体内部结构的同时,也保留了广泛的本体间知识链接,案例分析结果证明,多本体解析融合机制可以直观有效地构建跨本体知识交互。该方法有助于进一步推动农业本体的重用和共享,有效提升了农业信息资源标准化程度,所构建的农业多本体集成知识库为农业语义搜索、知识深度挖掘和智能化农业管理决策奠定了坚实的数据基础。

    多模态数据融合驱动的野外牧场虚拟电子围栏牲畜在栏判断模型
    李世杰, 孔繁涛, 曹姗姗, 孙伟
    2025, 7(4):  446-457.  DOI: 10.19788/j.issn.2096-6369.000115
    摘要 ( 14 )   HTML ( 2)   PDF (1664KB) ( 2 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    传统的野外牧场布设的铁丝网等物理围栏不利于牲畜转场、野生动物迁徙和草原生态连通性,现有虚拟电子围栏多借助于电子地图和牲畜个体佩戴的接触式智能项圈定位,动物应激反应大、设备易脱落且数据维护成本高。融合放牧机器人采集的双目立体视觉、GPS定位和IMU三类传感器数据,构建多模态数据融合驱动的牲畜位置感知与在栏判断模型。以野外牧场自然放牧状态下的牛只为研究对象,基于高德地图API构建牧场虚拟电子围栏边界数据;采用YOLOv8s模型提取基于双目立体图像的牛只个体目标信息,利用双目立体图像的深度信息解析识别的牛只目标与放牧机器人之间的空间距离信息,进而融合放牧机器人GPS绝对定位数据和IMU位姿数据,采用扩展卡尔曼滤波算法进行牛只空间位置的地理空间坐标映射,解算机器视野下牛只定位的经纬度坐标数据;引入顶点微调策略和缓冲区预警机制,采用改进的射线法(Pnpoly算法)获取虚拟电子围栏的牛只在栏判断数据。连续采集200条牛只移动轨迹数据,在凸多边形、凹多边形与不规则边界的虚拟电子围栏场景下进行数据融合、解析与获取的实验验证,在栏判断准确率97.8%,较传统算法提升4.3%。结果表明,基于机器视觉与传感器融合的多模态数据驱动方法在野外牧场环境下具备较强适应性和工程应用价值,可为牲畜管理提供非接触式、高精度、持续稳定的虚拟电子围栏空间管理数据。

    数据应用
    农业科学数据在线分析引擎设计与应用
    李佳乐, 贺子康, 姚琼, 赵晓燕, 周国民, 张建华
    2025, 7(4):  458-467.  DOI: 10.19788/j.issn.2096-6369.000131
    摘要 ( 16 )   HTML ( 4)   PDF (2030KB) ( 4 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对农业大数据时代数据富集、知识转化难、现有工具数据壁垒高、语义缺失、灵活性不足的问题,本研究设计并开发了农业科学数据在线分析引擎。该引擎采用分层架构,包含用户交互层、智能工作流引擎、知识库与状态管理模块、容器化执行层,核心创新在于:构建数据状态描述符与算子能力画像的元数据驱动机制,提出SC-MPARank混合推荐模型,设计领域语义导向的动态可进化流水线。引擎通过知识图谱实现“持续学习-实时推理”,兼具通用平台灵活性、专家系统专业性与AutoML自动化能力,可智能组织执行现有算法。现已实际应用于育种、耕地、农业绿色发展三大场景,有效降低技术门槛,提升数据到决策的转化效率与可靠性,为智慧农业提供了实用的农业科学数据分析工具。

    农业农村数据融合服务平台的设计与应用实践
    哈晓琳, 李杰, 原育慧, 张子怡, 梁敏燕
    2025, 7(4):  468-484.  DOI: 10.19788/j.issn.2096-6369.000130
    摘要 ( 14 )   HTML ( 4)   PDF (2534KB) ( 4 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    随着数字乡村战略的深入推进,农业农村领域对数据资源的集成共享、业务协同和智能服务提出了更高要求。本文针对农业农村数据资源汇聚与服务需求,提出了一种基于Hadoop的农业农村数据融合服务平台设计方案,创新性地构建了一种“云—边—端”+集中管理区的混合部署平台模型及其关键技术方案。平台依托“区块链+隐私计算”等先进的隐私保护与数据安全技术,打造支撑农业农村数据要素价值实现的技术基础,面向农业农村数据要素价值化需求,提供覆盖数据采集、治理、融合、应用全生命周期的管理能力与融通服务。平台目前已汇聚超过30个类别的农业农村数据,总量约500GB,涵盖生产、管理、服务等多个维度。围绕平台架构、部署架构、关键技术及应用场景展开研究,搭建农业农村现代化的数据融合服务平台,探索解决农业数据权属清晰、价值认定明确、交易过程可信的难点问题。利用大数据技术体系,促进涉农数据要素的流通共享、价值深度挖掘与资产高效转化。在典型查询场景下,平台实现了多维度数据检索平均响应延迟低于100毫秒的性能表现。平台能够显著提升交易过程的数据安全性与全链路可追溯性,有效解决海量农业农村数据在性能、容量与多用途支持上的不足问题,同时为跨部门政务协同与数据共享提供标准化范式,加速农业农村数据要素市场培育,赋能乡村数字经济高质量发展。

    数据管理
    科学数据视角下AlphaFold的迭代突破与数据策略启示
    欧阳峥峥, 马毓聪, 寇远涛, 鲜国建, 王辉, 赵群
    2025, 7(4):  485-495.  DOI: 10.19788/j.issn.2096-6369.000136
    摘要 ( 13 )   HTML ( 2)   PDF (450KB) ( 3 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    AlphaFold系列模型在结构生物学领域的革命性突破常被归因于算法创新,但其背后更为根本的科学数据策略演进却鲜有系统性剖析。本文从科学数据的核心视角出发,系统解构AlphaFold 1至3代的迭代突破机制,聚焦数据内在属性优化、表征范式革新、数据-模型协同适配三大关键层面,论证模型每一次性能跃升的本质均是数据-模型协同进化的结果。研究揭示:AlphaFold的演进是其数据策略从被动沿用、主动构建到生成赋能的历程。基于此,本文提炼出三大核心规律:表征范式的跃迁是突破的核心驱动,数据-模型的协同演进是成熟的关键标志,而数据内在属性的丰富度则决定了AI学习范式的上限。这些规律为AI for Science(AI4S)领域带来四大关键启示:数据工作需从被动准备转向主动设计;研发应从“模型/数据中心”转向以“契合度”为中心;数据体系构建应靶向提升核心属性而非盲目多模态聚合;业界亟待构建一套衡量数据“科学效能”的全新理论与评估框架,为AI驱动的科学发现提供理论支撑与路径参考。

    基于微博大数据的阳光玫瑰葡萄舆情挖掘与分析
    冯建英, 苗靖邦, 杨紫晗, 张乐, 穆维松
    2025, 7(4):  496-505.  DOI: 10.19788/j.issn.2096-6369.000113
    摘要 ( 12 )   HTML ( 2)   PDF (2657KB) ( 2 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    近年来,阳光玫瑰葡萄凭借独特口感在中国市场迅速扩张,但由于种植规模扩张引发品质分化与价格波动等问题,影响了产业的健康和可持续发展。本研究基于爬取的新浪微博阳光玫瑰博文大数据,通过LDA模型进行评论文本主题分析,基于SnowNLP进行消费者情感分析,系统挖掘公众对阳光玫瑰葡萄的舆情动态。研究发现,公众关注焦点集中于价格下跌、口感变化及农药残留争议。主题分析识别出品种特性与品种间比较、感官品质与安全性、价格与消费体验三类核心主题。情感分析中负面情感略高于正面,负面情感多源于口味不满、品质下降及安全担忧,正面评价则聚焦味道、便宜等特性。通过了解民众关注焦点与情感倾向,本研究可为合理规划阳光玫瑰葡萄产业发展、调整栽培措施、改良产品特性等提供参考。

    农村土地数据开发利用困境与法治进路探析
    李长健, 商守闯
    2025, 7(4):  506-518.  DOI: 10.19788/j.issn.2096-6369.000117
    摘要 ( 13 )   HTML ( 2)   PDF (478KB) ( 3 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    农村土地数据的数据化特征及其公共属性,决定了农村土地数据的开发利用区别于一般数据,并引发了对其开发利用主体、权利保护以及开发利用制度的重新审视。在我国农村土地场域中,农村土地数据的权利归属模糊不清、开发主体资格界定不明、价值导向不明与程序规范缺失等问题逐渐凸显。以上述现实困境为切入点,从制度和施行维度为农村土地数据要素的合法、有序开发利用提供理论和实践基础,通过剖析其背后的法律规制缺失、利益主体失衡、社会认知偏差与程序机制缺失等成因,构建农村土地数据法治体系尤为必要。据此提出要针对不同类型数据采用差异化的归属方案;明确开发主体的准入标准与退出机制;构建基于目的特定原则、比例原则以及最小限制与最大促进原则的数据使用机制,规范各类开发利用主体的利益行为;提出农村土地数据开发利用全过程程序性规范框架,旨在更好地保障各权利主体的权益,助力农业强国建设的长远目标。

    数据资源
    2024年鸡主要疫病流行动态数据集
    马秀丽, 刘存霞, 徐怀英, 郭效珍, 刘丽萍, 高月花, 朱彤, 鞠艳, 于可响, 胡峰, 吕俊峰, 赵巧雅, 黄兵, 李玉峰, 秦卓明, 刘小群
    2025, 7(4):  519-531.  DOI: 10.19788/j.issn.2096-6369.100061
    摘要 ( 22 )   HTML ( 5)   PDF (529KB) ( 5 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    近年来,规模化养禽业的持续发展带来了新的挑战,特别是在疫苗免疫的压力下,H9N2亚型禽流感、鸡传染性支气管炎等主要鸡病的病原发生了不同程度的变异。为了了解病害流行状况,积累数据,分析鸡病流行趋势,本研究收集了来自山东、河南等全国15个省市自治区的2135份临床疑似病例样本,构成数据集。并通过PCR检测技术,结合疑似病例的临床症状与病理剖检变化,对2024年送检的疑似病例进行了全面的实验室诊断。随后,针对那些危害严重的病原体,选取了关键基因进行测序分析。本数据集可用于鸡主要病毒病的分析、预测,为未来疫病防控工作提供了基础数据。

    数据摘要:

    项目 描述
    数据集名称 2024年鸡主要疫病流行动态数据集
    所属学科 兽医学
    研究主题 鸡的主要疫病
    数据时间范围 2024年
    数据地理空间覆盖 山东、河南、河北、江苏、辽宁、广东、广西、云南、湖南、湖北,安徽、辽宁、甘肃、黑龙江、内蒙古自治区
    数据类型及技术格式 .xlsx,.pdf
    数据集组成 数据集由1个表格和1个pdf文件组成,其中表格为2 135份鸡主要疫病检测数据;文件为相关数据分析。
    数据量 404.56 KB
    主要数据指标 病原;阳性率;基因型
    数据可用性 CSTR:17058.11.sciencedb.agriculture.00245; https://cstr.cn/17058.11.sciencedb.agriculture.00245
    DOI:10.57760/sciencedb.agriculture.00245; https://doi.org/10.57760/sciencedb.agriculture.00245
    经费支持 山东省重点研发计划(2022CXGC010606,2024CXGC010910,2022CXPT010-04,2025CXGC010803);2024年山东省农业重大技术协同推广计划(SDNYXTTG-2024-09);山东省家禽产业技术体系首席专家项目(SDAIT-11-01);山东省农业科学院农业科技创新工程基础研究任务(GXGC2024D11,CXGC2020C11)。
    禽腺病毒多重TaqMan荧光定量PCR检测数据集
    王利丽, 师延峰, 赵海明, 李富强, 崔松奇, 郭笑然, 李娥, 孙慧中, 李鹏飞, 任卫科, 田春利, 鄢明华
    2025, 7(4):  532-542.  DOI: 10.19788/j.issn.2096-6369.100063
    摘要 ( 17 )   HTML ( 3)   PDF (1808KB) ( 3 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    禽腺病毒自2015年在我国多省爆发后,给养禽业造成巨大损失。鸡群感染禽腺病毒后引起鸡心包积液-肝炎综合症、包涵体肝炎和肌胃糜烂等多种临床病症,且该病传播方式多样,发病没有明显的季节性,死淘率高(30%-80%),这些危害都给各养鸡场的生物安全防控水平提出了更多要求。如何保护鸡群体健康,保障养鸡场正常生产,是养鸡企业及相关科研单位关注的重点方向。本数据集包括临床样品采集数据、禽腺病毒12个血清型毒株的基因序列比较数据、荧光探针引物序列数据、禽腺病毒多血清型多重TaqMan荧光定量PCR检测方法数据及与行业标准同时检测161份临床样本数据集。数据显示此方法能特异性检测FAdV-4、FAdV-8a和FAdV-8b,与禽腺病毒其他血清型及NDV、AIVH9亚型、IBV等无交叉反应;最低检测值17 copies/μL;有良好的稳定性;与行业标准总阳性符合率为100.00%;天津及周边地区养鸡场禽腺病毒感染率偏低。本数据集可用于检测FAdV-4、FAdV-8a和FAdV-8b,为养鸡场禽腺病毒病的流行病学调查和早期快速筛查提供数据支撑,还可广泛用于养鸡场对其他疫病的生物安全防控技术的理论研究和实际应用。

    数据摘要:

    项目 描述
    数据库(集)名称 禽腺病毒多重TaqMan荧光定量PCR检测数据集
    所属学科 兽医学,家畜疾病学
    研究主题 禽腺病毒多重TaqMan荧光定量PCR检测
    数据时间范围 2023年-2024年
    时间分辨率 1年
    数据地理空间覆盖 天津及周边地区养鸡场
    数据类型与技术格式 .fas,.pdf,.xlsx
    数据库(集)组成 本数据集由5个数据组成,主要包括序列分析数据集、引物合成数据集、标准曲线扩增数据集、统计标准差平均值变异系数数据集、临床样品采集数据集。
    数据量 1.51 MB
    主要数据指标 保守基因分析、荧光探针引物信息、标准曲线扩增数据信息、组内及组间重复性扩增数据信息、临床样品数据信息
    数据可用性 CSTR:17058.11.sciencedb.agriculture.00248;https://cstr.cn/17058.11.sciencedb.agriculture.00248
    DOI:10.57760/sciencedb.agriculture.00248; https://doi.org/10.57760/sciencedb.agriculture.00248
    经费支持 中央级公益性科研院所基本科研业务费院级统筹项目:动物疫病数据中心;天津市科技计划项目(23YDTPJC00050);畜禽种质资源创新及高效繁育技术研究(2025ZYCX004)。
    2024−2025年北京温室种植蔬菜作物空气和土壤温湿度数据集
    张石锐, 贾宇轩, 李友丽, 郭园园, 曲明山, 张馨
    2025, 7(4):  543-550.  DOI: 10.19788/j.issn.2096-6369.100067
    摘要 ( 18 )   HTML ( 5)   PDF (2401KB) ( 4 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    温室蔬菜产业是北京都市现代农业中重要的种植业之一,是京郊农民增收的重要来源。东西垄种植减少了垄的数量,有利于智能水肥决策 方法和智能农机装备的应用,是提高温室生产效率的重要手段,然而,用于东西垄种植温室环境研究的数据还较少。2024年5月1日至2025年7月3日期间对北京市小汤山国家精准农业研究示范基地中采用东西垄种植的日光温室中的作物生长环境进行了监测。本数据集包含两季番茄-番茄-黄瓜-快菜4茬温室作物生长环境监测数据,数据包含生育期、空气温度、空气湿度、20cm土壤水分、40 cm土壤水分、60 cm土壤水分、20 cm土壤温度、40 cm土壤温度、60 cm土壤温度。其中空气温湿度数据采集间隔为5 min,土壤墒情数据采集间隔为15 min,数据量为4.59 MB,数据采用xlsx存储。该数据可用于分析不同作物类型下,东西垄温室的环境变化规律,从而制定合理的灌溉计划,构建智能灌溉决策模型。

    数据摘要:

    项目 描述
    数据库(集)名称 2024-2025年北京温室种植蔬菜作物空气和土壤温湿度数据集
    所属学科 农业科学
    研究主题 温室蔬菜种植
    数据时间范围 2024年5月1日-2025年7月3日
    时间分辨率 温室空气温湿度数据:5分钟,温室土壤温湿度数据:15分钟
    数据类型与技术格式 .xlsx
    数据库(集)组成 数据由四个表格文件组成,包含温室春茬番茄种植监测数据表、温室秋茬番茄种植监测数据表、温室黄瓜种植监测数据表和温室快菜种植监测数据表。
    数据量 4.59 MB
    主要数据指标 生育期、空气温度、空气湿度、20 cm土壤水分、40 cm土壤水分、60 cm土壤水分、20 cm土壤温度、40 cm土壤温度、60 cm土壤温度
    数据可用性 CSTR:17058.11.sciencedb.agriculture.00283; https://cstr.cn/17058.11.sciencedb.agriculture.00283
    DOI:10.57760/sciencedb.agriculture.00283; https://doi.org/10.57760/sciencedb.agriculture.00283
    经费支持 北京市农林科学院改革与发展项目感算融合的土壤墒情监测技术研究与智能传感器研发(GGFZ20240116)。
    2024年河南省农村教育投入与消费偏好调查统计数据集
    代佳敏, 艾丽菲热·吾甫尔, 张虹
    2025, 7(4):  551-560.  DOI: 10.19788/j.issn.2096-6369.100069
    摘要 ( 18 )   HTML ( 2)   PDF (785KB) ( 12 )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    教育支出日益成为农村家庭消费结构中的重要组成部分,其后蕴含着家庭对人力资本投资的策略选择与消费观念的转变。为深入了解农村居民在教育投入与消费偏好方面的真实状况,研究团队于2024年6-7月在河南省5个县15个乡镇开展了大规模入户问卷调查,形成了2024年河南省农村教育投入与消费偏好调查统计数据集。该问卷涵盖了家庭人口与收入信息、教育支出结构、线上教育使用情况、教育观念与焦虑感知等多个维度,共回收问卷3 169份,经缺失值与逻辑一致性审查后剔除67份,最终保留有效样本3 102份。问卷设计结合专家访谈与文献调研,数据采集过程中采用实地入户访问与随机抽样相结合,并通过双录入校验、异常值剔除和逻辑一致性审查等方式严格控制质量。与以往侧重宏观统计的研究不同,本数据集在微观层面揭示了农村家庭教育支出行为、消费偏好选择及教育焦虑特征,为实证检验“教育支出挤出效应”、探讨线上教育对教育公平的作用机制、分析不同收入群体的消费差异提供了坚实的数据支撑。同时,该数据集也为教育资源精准配置、农村家庭教育负担评估及数字教育产品推广提供了实践参考。

    数据摘要:

    项目 描述
    数据集名称 2024年河南省农村教育投入与消费偏好调查统计数据集
    所属学科 农业经济管理,农业社会学
    研究主题 农村教育支出行为与家庭消费偏好结构
    数据时间范围 2024年6月至7月
    数据地理空间覆盖 中国河南省中牟县、延津县、商水县、卢氏县、淮滨县下辖15个乡镇
    数据类型与格式 .xlsx
    数据库(集)组成 数据集包含1个原始主数据文件及多个处理衍生文件,覆盖3102户农村家庭的结构化问卷数据,变量数超过150项。
    数据量 462.29 KB
    主要数据指标 家庭人口信息,年收入结构,教育支出构成与阶段分布,线上教育使用频率与支出水平,教育观念与焦虑评分,消费偏好排序,政策认知等。
    数据可用性 CSTR:17058.11.sciencedb.agriculture.00287; https://cstr.cn/17058.11.sciencedb.agriculture.00287
    DOI:10.57760/sciencedb.agriculture.00287; https://doi.org/10.57760/sciencedb.agriculture.00287