农业大数据学报 ›› 2025, Vol. 7 ›› Issue (4): 458-467.doi: 10.19788/j.issn.2096-6369.000131

• 数据应用 • 上一篇    下一篇

农业科学数据在线分析引擎设计与应用

李佳乐1,2(), 贺子康1,2(), 姚琼1,2, 赵晓燕1,2, 周国民3,4,5,*(), 张建华1,2,*()   

  1. 1.中国农业科学院农业信息研究所北京 100081
    2.中国农业科学院国家南繁研究院海南三亚 572024
    3.农业农村部南京农业机械化研究所南京 210014
    4.国家农业科学数据中心北京 100081
    5.中国农业科学院西部农业研究中心新疆昌吉 831100
  • 收稿日期:2025-09-04 修回日期:2025-10-22 出版日期:2025-12-26 发布日期:2025-12-26
  • 通讯作者: 周国民;E-mail:zhouguomin@caas.cn
    张建华,E-mail:zhangjianhua@caas.cn
  • 作者简介:李佳乐,E-mail:2532211923@qq.com
    贺子康,E-mail:hezikang@caas.cn
  • 基金资助:
    国家重点研发计划(2022YFF0711800);海南省自然科学基金(325MS155);三亚崖州湾科技城科技专项资助(SCKJ- JYRC-2023-45);中国农业科学院国家南繁研究院南繁专项(YBXM2448);中国农业科学院国家南繁研究院南繁专项(YBXM2340);中国农业科学院国家南繁研究院南繁专项(YBXM2409);中国农业科学院国家南繁研究院南繁专项(YBXM2410);中国农业科学院国家南繁研究院南繁专项(YBXM2430);中国农业科学院国家南繁研究院南繁专项(YBXM2508);中国农业科学院国家南繁研究院南繁专项(YBXM2509);中国农业科学院农业信息研究所/国家农业科学数据中心项目(NASDC2025XM11);中央级公益性科研院所基本科研业务费专项(JBYW-AIl-2025-05);中央级公益性科研院所基本科研业务费专项(Y2025YC90)

Design and Application of Online Analysis Engine of Agricultural Science Data

LI JiaLe1,2(), HE ZiKang1,2(), YAO Qiong1,2, ZHAO XiaoYan1,2, ZHOU GuoMin3,4,5,*(), ZHANG JianHua1,2,*()   

  1. 1. Agricultural Information Institute of CAAS, Beijing 100081, China
    2. National Nanfan Research Institute (Sanya), Chinese Academy of Agricultural Sciences, Sanya 572024, China
    3. Nanjing Research Institute of Agricultural Mechanization, Ministry of Agriculture and Rural Affairs, Nanjing 210014, China
    4. National Agriculture Science Data Center, Beijing 10081, China
    5. Western research institute, CAAS, Changji 831100, China
  • Received:2025-09-04 Revised:2025-10-22 Published:2025-12-26 Online:2025-12-26

摘要:

针对农业大数据时代数据富集、知识转化难、现有工具数据壁垒高、语义缺失、灵活性不足的问题,本研究设计并开发了农业科学数据在线分析引擎。该引擎采用分层架构,包含用户交互层、智能工作流引擎、知识库与状态管理模块、容器化执行层,核心创新在于:构建数据状态描述符与算子能力画像的元数据驱动机制,提出SC-MPARank混合推荐模型,设计领域语义导向的动态可进化流水线。引擎通过知识图谱实现“持续学习-实时推理”,兼具通用平台灵活性、专家系统专业性与AutoML自动化能力,可智能组织执行现有算法。现已实际应用于育种、耕地、农业绿色发展三大场景,有效降低技术门槛,提升数据到决策的转化效率与可靠性,为智慧农业提供了实用的农业科学数据分析工具。

关键词: 农业大数据, 在线分析引擎, SC-MPARank 混合推荐模型, 知识图谱

Abstract:

Aiming at the problems of data enrichment, difficult knowledge transformation, high data barriers of existing tools, missing semantics, and insufficient flexibility in the era of agricultural big data, this study designs and develops an online analysis engine for agricultural scientific data. The engine adopts a layered architecture, including a user interaction layer, an intelligent workflow engine, a knowledge base and state management module, and a containerized execution layer. The core innovations of the engine: constructing a metadata-driven mechanism with data state descriptors and operator capability images, proposing a hybrid recommendation model of SC-MPARank, and designing a dynamic and evolvable pipeline with a domain semantics orientation. The engine achieves ‘continuous learning - real-time inference’ through knowledge graph, combining the flexibility of a general platform, the expertise of an expert system and the automation capability of AutoML, and can intelligently organize the execution of existing algorithms. The engine has been practically applied to three major scenarios of breeding, cultivation, and agricultural green development, effectively reducing the technical threshold, improving the efficiency and reliability of data-to-decision transformation, and providing a practical agricultural scientific data analysis tool for smart agriculture.

Key words: agricultural big data, on-line analysis engine, SC-MPARank hybrid recommendation model, knowledge graph