随着互联网的普及,农业知识和信息的获取变得更加便捷,但信息大多固定且通用,无法针对具体情况提供定制化的解决方案。在此背景下,大语言模型(Large Language Models,LLMs)作为一种高效的人工智能工具,逐渐在农业领域中获得关注和应用。目前,LLMs技术在农业领域大模型的相关综述中只是简单描述,并没有系统地介绍LLMs构建流程。本文重点介绍了农业垂直领域大语言模型构建流程,包括数据采集和预处理、选择适当的LLMs基模型、微调训练、检索增强生成 (Retrieval Augmented Generation,RAG)技术、评估过程。以及介绍了LangChain框架在农业问答系统中的构建。最后,总结出当前构建农业垂直领域大语言模型的一些挑战,包括数据安全挑战、模型遗忘挑战和模型幻觉挑战,以及提出了未来农业垂直领域大语言的发展方向,包括多模态数据融合、强时效数据更新、多语言知识表达和微调成本优化,以进一步提高农业生产的智能化和现代化水平。
水稻是我国三大粮食作物之一,准确、高效、及时地预测水稻产量对品种选育和优化田间管理至关重要。无人机遥感系统凭借其快速、无损、成本低、通量高等优势,被广泛应用在作物病虫害识别、作物生长监测和作物表型分析等领域。为探究光谱数据在水稻产量估测方面发挥的作用,本数据集利用无人机遥感采集了水稻生长过程中的多光谱图像。选取106个1 m×1 m的样本点人工采样测产,同时在采样后采集了可见光图像,实现光谱图像和产量数据间的关联。经过人工检查和整理构建了本数据集。数据采集地点为黑龙江省,无人机在无云、光照充足的条件下进行数据采集,采集时间为2023年7月至2023年8月,共采集试验田内不同品种3天的多光谱数据和1天的可见光数据。本数据集各项数据完整,可为产量估测研究提供数据支撑。
数据摘要:
大田作物大多采取露地种植方式。东北地区全年温度较低,在作物苗期如果出现日照和降雨量大范围的波动,则十分容易导致农作物出现苗弱苗小、根系长势弱以及发育不全和生长缓慢等现象。若能对农作物苗期实时监测和管理,及时掌握其生长状态及其环境情况,便可及早做出决策。本研究于2022年5月9日—2022年6月16日期间,对试验田内11个气象站的小麦、玉米和水稻、小麦苗期图像进行采集,通过整理和筛查后形成的数据量约为2.59 GB,其中可见光RGB 1.48 GB,近红外光谱 1.11 GB。本数据集可以通过RGB可见光数据和近红外光谱数据完成对作物的叶龄识别,将提取出的特征(颜色特征、图像特征、纹理特征、植被指数)带入机器学习回归模型中进行分析预测,同时本数据集还适用于构建作物识别或幼苗识别的卷积神经网络模型,以进一步精准实现作物检测及插秧后漏苗、补苗等研究。
在当前信息化高速发展的背景下,智慧农业作为农业发展的必然趋势,其中农业大数据是实现智慧农业的重要支撑。尽管农业大数据带来了巨大的产业动能,但也伴随诸多的数据安全问题,有效处理农业大数据技术与数据安全的关系显得至关重要。首先综合分析当前各种观点重新定义了农业大数据,然后通过案例详述了其在农业供应链各环节中的促进作用,接着深入剖析了农业大数据的泛在性、社会性、交叉性等专有特征。最后,基于安全三项基本要素(机密性、完整性和可用性)以及农业大数据的专有特征,从数据采集、数据传输、数据存储等大数据生命周期的七个阶段出发,构建了智慧农业场景下的大数据安全风险框架。从大数据存在的共性问题引出农业领域下基于专有特征的特性问题,并结合实际智慧农业场景,提出了有针对性的安全解决策略。本文将对未来研究智慧农业领域中数据安全问题的解决方案提供新思路,旨在促进智慧农业更快更安全发展。
当前我国农业生产模式从传统向智慧农业转型,针对各农业组织自身数据规模不断扩大,数据共享出现“数据孤岛”难以大规模汇聚农业数据指导精准农事决策等问题,本研究基于云链融合和分布式农业场景下数据安全治理相关技术解决所述问题,并探索其实际应用效果。在分布式农业场景下,以IPFS、区块链和云计算为基础,设计可部署在智能合约的农业大数据治理算法,构建多方农业数据汇聚模型以及完整、安全、可追溯的数据保护模型和典型场景应用模型。以新疆昌吉华兴农场及其附属农业组织农业生产为例,进一步构建云链融合农业大数据平台。对比本文所设计的基于云链融合的农业大数据治理模型和两种传统模型的性能,实验表明,本模型综合性能相比于传统模型更优。
及时发现小麦田间赤霉病发生情况并根据发病严重程度采取相应的防治措施,有利于提高小麦的产量和质量。当前识别小麦赤霉病严重度的方法大多基于一株或几株麦穗进行识别,这种方式由于效率较低不适用于田间调查。为解决该问题,该研究提出一种高效准确的田间小麦赤霉病严重度识别方法。通过引入CBAM注意力机制以改进YOLOv8m-seg模型的性能。利用改进的YOLOv8m-seg模型对采集的远景图像进行小麦麦穗实例分割,然后基于非目标抑制方法进行单株小麦麦穗切图,再利用改进的YOLOv8m-seg模型对每一株小麦麦穗中的病小穗和健康小穗进行实例分割,最后通过病小穗和健康小穗的数量计算每一株小麦麦穗的赤霉病严重度。为验证本文方法的有效性,构建了小麦麦穗(D-WE)和小麦小穗(D-WS)两个数据集进行测试。试验结果表明YOLOv8m-seg在两个数据集上的综合性能优于YOLOv8n-seg、YOLOv8s-seg、YOLOv8l-seg和YOLOv8x-seg。引入CBAM的模型优于引入SE、ECA和CA注意力机制的模型,与原模型相比,改进YOLOv8m-seg模型的平均精度均值在两个数据集上分别提高了0.9个百分点和1.2个百分点。该研究提出的小麦赤霉病严重度识别方法与其他三种识别方法相比严重度准确率分别提高了38.4个百分点、6.2个百分点和2.4个百分点,通过TensorRT将改进的YOLOv8m-seg模型部署后总算法耗时仅仅为原来的1/7。最后,该研究基于AR眼镜进行三地的小麦田间赤霉病严重度调查,调查结果表明,基于AR眼镜的小麦赤霉病智能识别平均病穗计数准确率高达0.953,且调查耗时仅为人工调查的1/3,充分说明了该研究提出方法的有效性,为智能化小麦赤霉病田间调查奠定良好的基础。
冬小麦和夏玉米是黄淮平原农田生态系统中的主粮作物,为保障国家粮食安全作出了突出贡献。准确掌握主粮作物关键物候期对估算作物产量、改进农业生产管理水平、预防农业气象灾害具有重要意义。本数据集整合了黄河故道冲积平原区近15年(2008—2022年)一年两熟冬小麦-夏玉米连作制度下作物不同物候期的生态观测数据,主要包含观测样地信息、冬小麦物候期数据、夏玉米物候期数据。本数据集将为区域农业定量遥感研究、作物生长模型模拟研究、农业气候变化研究及农业生产和管理决策提供科学依据和数据支撑。
农业是最基础、最有代表性的传统产业,加快建设农业强国,亟需培育和发展农业新质生产力。数字技术是新一轮科技革命和产业变革的先导力量,全面推动数农融合的智慧农业将成为加快形成农业新质生产力的重要着力点。该文从马克思主义生产力理论出发,对新质生产力的科学内涵、农业新质生产力的基本特征及智慧农业建设的现实需求、发展趋势、重点方向等进行研究,将国内外文献、统计数据、调研结果相结合,提出强力推进智慧农业建设、加快形成农业新质生产力良好生态的路径措施。我国智慧农业建设正从“盆景”转变为“风景”,已进入大数据、物联网、区块链、人工智能、卫星遥感、北斗等多种现代信息技术协同高效、系统集成的新阶段,需从重点行业着手,加快形成智慧农业建设发展的大气候。要把智慧农业作为推进农业强国建设的重要抓手,解决好数据这个最大的制约因素,推动现代信息技术与农业产业深度融合,打造高素质创新型劳动者队伍,充分发挥企业的创新主体作用,加强关键核心技术攻关,顺应数字化、绿色化两大转型的发展大势,加快培育和发展农业新质生产力。
蒙古国草地系统的健康状况关系着其畜牧业效益和国内外生态安全。衡量牲畜放牧密度并合理控制放牧密度对于维护蒙古国草地生态系统健康以及实现畜牧业的可持续发展具有重要意义。空间放牧密度梯度信息的缺失阻碍了对草地承载力相关研究的推进。本研究基于2015年世界网格化牲畜数据集(gridded livestock of the world,GLW)、牧区人口密度、土壤水分、年降水、地表温度和净初级生产力(net primary productivity,NPP)等空间数据,利用谷歌地球引擎(Google Earth Engine,GEE)云平台运行随机森林回归算法,建立了蒙古国放牧密度估算模型;基于省域牲畜存栏量统计数据检验了模型的准确性,并结合不同年份预测因子数据,模拟了蒙古国2006—2020年放牧密度空间分布。为确保数据集的准确性,采用判定系数(R²)、平均绝对误差(MAE)和均方根误差(RMSE)三个误差测量指标对数据集进行校验。模拟结果显示,2006—2020年蒙古国放牧密度在空间上整体呈现北高南低的特点;2006—2010年蒙古国放牧密度扩张明显,放牧密度高于5 TLU/km2区域面积占比由0.223%增加到51.390%;2010—2020年,蒙古国大部分地区放牧密度无显著变化。检验结果表明,该数据集较好地实现了蒙古国放牧密度空间化的模拟,2006、2010、2015和2020年模拟数据与蒙古国省域牲畜存栏量拟合R2分别为0.844、0.734、0.914、和0.926,均通过显著性检验,MAE分别为5.195、3.513、2.336、3.461,RMSE分别为8.135、5.257、4.200、5.909。本研究提供的蒙古国放牧密度数据集对该地区草地生态系统的可持续发展以及牧民的生计安全提供了重要信息支撑。
随着人工智能、计算机视觉、深度学习等科学技术在农业领域的发展与应用,数据驱动的农业深度学习模型成为农业科学的新型研究范式,农业数据集是深度学习模型训练的基础,高质量、大规模、多样性的数据集能够有效提升模型性能,从而助力深度学习在智慧农业领域的应用。为帮助相关领域研究者更好地了解数据对于深度学习的驱动力,充分发挥深度学习在农业领域的应用,本文通过计量分析的方法,总结农业数据集的类型、规模、来源等基本特质,根据深度学习方法将其划分为目标检测、图像分割、图像识别等4个类别,根据应用领域将其划分为视觉导航、特征识别、无损检测等7个类别。结果显示,数据集类型以图像数据为主,图像的数据量主要集中在50—1 500张范围内,由于农业数据采集的特殊性,数据集大部分由个人构建,部分来自公开数据集,主要利用数据集开展特征识别。在未来,随着模型的规模越来越大,对于数据集的要求也不断升级,因此需要持续构建大规模、分布均衡、标注准确的数据集。本文通过强调数据对深度学习模型的驱动力及重要性,为数据推动深度学习农业应用提供理论依据。
随着全球数据安全法律法规愈发关注隐私保护,以及数据主权、科技竞争和地缘政治等新型治理因素的影响,科学数据的“保护”要求不断提高。这种趋势在一定程度上抑制了数据采集、处理、传输和分析等“利用”功能,并对既有科学数据的“保护-利用”平衡产生了负面影响。目前,这种失衡趋势表现为法律合规负担过重以及公共科学数据可用性逐渐减弱等治理挑战,现有研究和实践缺乏必要的分析工具来全面、系统地理解并应对这些挑战。为填补这一空白,论文提出了一个基于规则的科学数据安全治理框架,旨在从法律法规、伦理规范和机构政策等安全治理规则的角度系统分析“保护-利用”失衡及相关挑战。该框架整合了主要的科学数据安全治理规则类型,并结合“岛桥模型”、“法律-伦理”均衡和“适度落实”原则等三项分析工具,构建了治理规则与“保护-利用”平衡之间的传导路径。通过这一框架,论文解释并初步验证了其在理解科学数据合规责任过重和公共科学数据可用性弱化两大挑战中的应用价值。在全球科学数据安全法规日趋严苛的背景下,本文提出的基于规则的分析视角及相关工具,丰富了科学数据安全治理的理论基础,并为学术界、数据管理者和政策制定者提供了应对当前挑战的有效工具和政策沟通的理论支撑。这一框架为未来在数据安全治理中的应用和扩展提供了重要参考,也为保障科学数据的可持续利用提供了关键指导。
小麦是全球主要粮食作物之一,随着物联网技术的发展,多光谱动态采集技术通过捕捉丰富的光谱信息,识别可见光范围内难以区分的物质和特征,从而为水肥亏缺诊断、病虫害预警等提供更详细的数据支撑。目前大部分研究采用无人机遥感平台搭载多光谱相机获取小麦冠层多光谱图像,然而无人机运行维护成本较高,且无法实时采集小麦整个生长周期内的连续生长信息,相比而言,多光谱原位监测设备能够逐日实时采集特定区域内作物整个生长周期的生长数据,从而实现连续性的作物生长动态监测。本研究在2024年4月9日至6月6日期间,对北京市小汤山国家精准农业研究示范基地内设置的试验田小麦的拔节期、孕穗期、开花期和灌浆期图像进行了采集。经筛选和整理后形成的有效数据为每日6点-18点采集的多光谱图像,采集频率为一小时,数据量为1.42 GB。图像数据由布设在自然大田环境中的多光谱原位监测设备定时拍摄而得,并以文件夹形式存储。图像经过专业人员筛选和整理,确保数据高质量和可靠性。本数据集可通过多光谱图像数据实现对小麦的水肥亏缺诊断、病虫害监测等任务,将提取出的反射率值、植被指数、颜色特征、纹理特征、植被覆盖度等信息带入预测模型中进行分析预测,同时本数据集还适用于构建小麦叶绿素含量、生物量估算的网络模型等研究。
近年来,随着数据安全监管的日益收紧,科学数据管理面临越来越严峻的“安全合规”挑战,数据分类分级保护逐渐成为学术界、数据管理实践者和监管机构共同关注的议题。然而,现有的研究和实践大多局限于对数据合规的解释与反应性应对,缺乏对科学数据分类分级保护的系统性和理论性讨论。这种认知不足限制了科学数据安全管理领域理论框架和实用模型的发展。为形成对科学数据分类分级保护的系统性理解,本研究基于对现有实践的广泛调查,提炼出科学数据的六项关键安全特征:多重规制、伦理强规制、学科领域差异性、“规模-风险”帕累托分布、公益性和动态敏感性,以此六项特征为基础,构建了科学数据安全分类和分级框架,并提出了全面、平衡与精简三种保护模式。研究提出了“数据合规-合规成本-数据收益”三角平衡观点,合理解释了三者之间的权衡关系。文中还详细讨论了数据安全分类与安全分级的区别及其相互作用,澄清了科学数据安全分类的复杂性。该研究提出的针对科学数据分类分级保护的理论框架为分析科学数据安全管理中的复杂问题提供了框架性工具,可为相关研究提供有价值的参考,有助于推动科学数据安全保护实践。
随着多模态基础模型(大模型)的发展,如何高效地将其迁移到特定领域或任务中成为目前的热点、难点问题。该研究以多模态大模型CLIP为基础模型,使用参数高效微调方法Prompt、Adapter将CLIP迁移到枸杞虫害识别任务中,提出了用于枸杞虫害识别的跨模态参数高效微调模型D-PAG。D-PAG模型首先在CLIP编码器的输入层或隐层中嵌入了可学习的Prompt与Adapter,用于训练,学习虫害特征;然后利用门控单元将Prompt、Adapter集成到CLIP编码器网络中,平衡两者对特征提取的影响大小,在Adapter中设计了GCS-Adapter注意力用以加强跨模态语义信息融合。为了验证方法的有效性,在枸杞虫害数据集和细粒度数据集IP102上进行了实验。验证实验结果表明,在枸杞数据集上仅用20%样本数量训练便可达到98.8%的准确率,使用40%样本数量训练准确率达到了99.5%;在IP102上验证,准确率达到75.6%,与ViT持平。该方案可在少样本条件下,通过引入极少额外参数,将多模态大模型基础知识高效迁移到特定虫害识别领域,为高效使用大模型解决农业图像处理问题提供了新的技术方案。
针对枸杞种植中面临的虫害细粒度分类难题,提出了一种农业虫害细粒度分类模型——基于空间特征融合的数据增强视觉Transformer(ESF-ViT)。首先,该模型利用自注意力机制裁剪出前景目标的图片以增强图像输入,补充更多细节表示;其次,结合自注意力机制与图卷积网络提取害虫区域的空间信息,学习害虫的空间姿态特征。为了验证本文所提模型的有效性,在CUB-200-2011、IP102以及宁夏枸杞虫害数据集WPIT9K上开展实验研究,实验结果表明本文所提方法相比基础ViT模型分别提升了1.83%、2.09%和2.01%,并且超越了现有最新的虫害分类模型。所提模型能够有效地解决农业虫害识别领域中的细粒度虫害图像分类问题,为虫害的高效监测预警提供视觉模型。
数字化平台是各大主体抢占新一轮科技产业革命制高点的重要机遇,其以低成本、高包容、高效率以及高价值的方式有效链接起了生产者与消费者,在助力乡村振兴、实现共同富裕的战略任务中发挥着重要作用。本文以浙江“网上农博”平台为例,分析了数字化平台的框架与功能,展示了数字化平台赋能共同富裕的初步成效,提炼了数字化平台赋能共同富裕的理论框架,讨论了数字化平台赋能共同富裕的制约因素和实质问题。针对数字化平台中存在的企业责任不明确、利益分配不均衡、数字平台应用不平衡以及公益性数字化平台的发展阻碍等问题,本文提出了明确责任边界、公平配置资源、优化平台功能、探索可持续性的盈利模式以及多方协同支持等对策建议,为解答数字化平台如何更有效地促进共同富裕提供了参考。
小麦纹枯病是我国麦区常发的土传真菌病害,在小麦整个生育期均可发生,对我国小麦产量和品质影响极大。通过构建小麦纹枯病防治领域本体,对领域知识进行建模,以期整合和共享小麦纹枯病防治领域的知识,为农业决策、病害防治等方面提供重要的支持和指导。本研究以小麦纹枯病防治领域文献为数据源,采用KeyBERT关键词提取算法挖掘本体核心概念,通过层次聚类提取本体概念间层次关系。最后利用Protégé对本体概念、概念间关系进行可视化表达。本研究提出了小麦纹枯病防治领域本体构建方法,阐述了通过构建小麦纹枯病语料库来构建本体的基本方法,给出了领域本体构建的流程框架,详细阐述了构建中所使用的算法和构建工具。本研究数据源主要为科技文献,未来可进一步扩充数据源,对本体进行扩展。本体评估部分目前主要依靠领域专家评估,未来可增加量化评估。本研究所构建的小麦纹枯病防治领域本体包含了较完整的小麦纹枯病概念体系,符合本体评价标准和本体构建需求,可为领域本体的构建提供借鉴与参考,为小麦纹枯病防治领域的知识发现与智能问答、智能推荐等下游应用提供有力支持。
俄罗斯远东和中国东北所在的黑龙江跨境流域地区拥有丰富的自然资源,在农业资源开发利用方面具有巨大潜力。面临全球冲突不断增加和粮食供应链的短缺危机,加强黑龙江跨境流域农业资源的监测和开发利用,对于保障全球粮食安全具有重要意义。该数据集以黑龙江跨境流域作为研究区,运用机器学习和样本迁移方法,构建一套全面的农作物精细分类体系。基于历史遥感影像数据以及Google Earth Engine(GEE)云平台,以Landsat和Sentinel影像为数据源,完成2015、2020和2023年小麦、玉米、大豆、水稻等主要农作物分类,总体精度超过84%,Kappa系数大于0.81。通过时空变化分析,揭示了黑龙江跨境流域农作物的格局与变化特征,对该流域耕地资源优化配置提供决策支持。
蒙古高原是我国北方重要生态屏障,蒙古国生态功能的稳定与健康对于深入了解全球气候变暖的区域植被响应特征及筑牢我国北方生态屏障具有重要的理论与现实意义。植被覆盖度(FVC)是指评估地表植被覆盖程度的指标,通常用于衡量植被对地表的覆盖情况,是评价草原生态系统健康的重要指标之一,对及时监测草原植被的变化情况、发现草原退化和恢复的趋势具有重要意义。植被覆盖度的变化直接影响土壤侵蚀和水土流失,监测和控制植被覆盖度有助于减缓土壤侵蚀速度,维护草原生态系统的稳定性。本研究旨在生成并验证1990年至2022年间空间分辨率为1/12°的年度FVC数据集,以反映长时间序列下蒙古国植被覆盖度空间分布情况。为确保数据集的准确性和可靠性,研究结合了MOD13Q1数据进行计算校准和验证,以确保FVC计算的精度。本研究通过植被覆盖度数据集的构建,为蒙古国草原生态系统的保护与管理提供了科学依据。
生命组学大数据是国家重要基础性、战略性资源,对支撑生命科学基础研究和应用创新、推动生物经济创新发展、维护国家安全具有重要意义。随着数据规模的不断增长,生命组学大数据的安全管理问题逐渐凸显。国家基因组科学数据中心(National Genomics Data Center, NGDC)面向我国人口健康和社会可持续发展的重大战略需求,建立了生命与健康大数据汇交存储、安全管理、开放共享与整合挖掘研究体系,形成了一系列数据安全管理的制度和措施。本文聚焦于生命组学大数据全生命周期的安全管理问题,探讨生命组学大数据安全管理框架,全面分析在数据汇交、存储、管理、共享全生命周期中涉及的安全管理内容,并总结了NGDC在生命组学大数据安全管理方面的成效。最后,本文展望了生命组学大数据安全管理的发展方向,包括完善数据分级分类制度、提升数据分级安全管理技术和加强数据异地灾备建设,以期实现生命组学大数据的安全管理与可持续发展。
在大数据时代背景下,科学数据中心的蓬勃发展使其绩效评价逐渐成为研究热点。通过对国内近十年科学数据中心评价相关成果的系统梳理,为我国科学数据中心评价模型的深化研究提供理论依据和参考。运用科学知识图谱法,借助CiteSpace软件对2013-2023年期间CNKI的科学数据中心评价研究相关文献进行关键词共现分析。研究发现:研究演进上看,2015-2019年为高峰期,文献数量呈现爆发式增长;研究热点上看,可归纳为评价对象、评价领域、评价指标体系、绩效评估模式。经过对各个主题的深入分析,发现科学数据中心评价已经有一定程度的研究成果积累,然而,对于我国的科学数据中心体系而言,现有的评价体系在可比性和通用性方面存在一定的不足,这对科学数据中心的协调统一发展形成了阻碍。
随着农业农村现代化建设的推进,投资需求日益增长,但中央财政投入相对有限,亟需引导金融社会资本投入。本文综述了相关研究及实践情况,探讨了农业农村部开发建立农业农村基础设施建设融资项目库,并升级为综合融资服务平台的探索与实践。分析了融资项目库的成效与不足,阐述了项目库升级至综合融资服务平台的建设思路、主要功能和架构设计,并提出了深化投融资数据资源开发与共享的措施,以及对平台未来发展的展望。未来,该平台有望进一步完善功能,提升服务质量,吸引更多金融机构和企业入驻,为农业农村重大项目投融资提供更有力支持,推动农业农村经济持续发展。
开放科学数据是开放科学中的必要组成部分,平衡科学数据的开放共享与安全防护是开放数据实践中面临的重要问题。科学数据存储库作为数据共享主要的承载平台,在确保开放共享中的数据安全等关键问题上,发挥着重要作用。本研究通过ScienceDB的具体业务场景分析,构建了面向通用型数据存储库科学数据银行的数据安全治理体系框架。该框架在信息系统安全等级保护基本要求(三级)的基础上,重点在安全组织制度、资源安全管理、环境安全管理三个维度展开了设计和建设。研究总结了科学数据银行安全体系建设成效,从顶层布局到建设实践层面,对数据存储库的安全建设提出建设建议。
对于当下强烈的农业干旱监测需求,一套可靠、高效的时空变化监测及评估方案是非常必要的。本研究基于1990-2022年的土壤湿度网格数据,选取经典的农业干旱指数SMCI(Soil Moisture Condition Index)和SSI(Standardized Soil Moisture Index),设计了一套多视图协同、交互式的可视化分析方案,为多维的干旱数据分析提供了一种更加全面的、易于感知的新视角。结果表明:1)通过对贵州省干旱在年、季、月不同时间尺度下干旱的强度和空间变化进行分析,详细把握了贵州省这32年间的干旱时空变化,证明了本研究在干旱时空演化特征分析上的有效性;2)通过对SMCI和SSI在不同场景下的适用效果进行比较,评估了不同监测手段的干旱分析优势,证明了本研究可以用于干旱指数的比较。在当前的农业干旱监测中,协同可视化的分析手段可以有效提升监测效果。
对2016-2023年参加山西省品比试验的1439个玉米杂交种通过人工接种的方法,进行了大斑病田间表型抗性分析。本数据集以Excel格式存储,共包含1439行数据,其中每一行代表一个玉米品种。数据集中的列包括:玉米类型、品种名称、熟期、播种时间、接种时间、抗性调查时间、各品种大斑病抗性分级等。该数据集的建立和共享可为抗大斑病玉米品种的筛选和后续推广利用提供技术支撑,同时为抗大斑病材料的选育提供参考资料。
香气是葡萄重要的品质性状之一,也是葡萄品质研究的热点和分子设计育种的重要内容。葡萄种质资源丰富,在香气性状上也表现出了丰富的遗传多样性。本研究使用固相微萃取—气相色谱—质谱联用技术(SPME-GC-MS)对242个葡萄品种果实香气组分和含量进行了测定,并开展了组分与感官评价的相关性、组分之间的相关性和品种之间的主成分分析。共检测出526种挥发性组分,并从中筛选出108种可能的香气组分,包括酯类、醇类、醛类、酮类、萜类、烃类、酸类和呋喃类共8种类型,从种类数上看,酯类最多,其次是萜类,从频次上看,醛类最高,其次是烃类和醇类。与香味感官评价相关性系数最高的前十种组分包括6种酯类、3种萜类和1种烃类,其中己酸乙酯相关系数最高,其次为2—己烯酸乙酯和芳樟醇。同种类型的组分之间表现出了较高的相关性,特别是酯类、萜类和呋喃类,不同类型的相关性比较低。主成分分析大部分的品种聚在一起,并在三个主成分方向上存在发散,并且与感官评价的结果高度一致。本研究为研究葡萄香气性状遗传多样性和种质特异性提供了重要的数据支持。
国家科学数据是新时期新质生产力发展的核心要素。促进科学数据要素化发展,有利于提升我国产业链供应链韧性和安全水平,是推进高水平科技自立自强的内在要求和有力抓手。“十三五”国家重点研发计划67个专项6000多个重点项目实施已有一个完整周期的实践,国家科学数据在体量和价值上具有要素化的必要性和充分性。本文结合新时代国家重点研发计划科学数据实践,从制度机制、专家队伍、经费预算和激励机制等方面,分析国家数据汇交的事前事中事后各环节对数据要素化的影响,并围绕提升我国产业链供应链韧性和安全水平,从科学数据要素强链补链延链提链角度,探索如何通过科技计划政策机制促进数据要素化并提出政策建议。
中俄黑龙江跨境流域的土地资源优越,是东北亚粮食生产潜力巨大的区域。掌握其过去土地覆盖和耕地变化对区域农业资源开发利用具有重要意义。针对该区域长期土地覆盖和农业资源认识不足的问题,本文基于GlobeLand 30和GLC_FCS 30数据集,获取1990年、2000年、2010年、2020年的30米分辨率土地覆盖数据,引入土地覆盖转移矩阵、动态度以及变化强度等模型对黑龙江流域的土地覆盖变化进行分析,重点探讨耕地资源变化及其中俄对比。结果表明:黑龙江流域土地覆盖类型中林地占主导地位,其次为草地和耕地,水域、建设用地和未利用地占比较小。1990-2020年,耕地面积呈现出先减少后增加趋势,其中1990—2000年变化最大,而2010—2020年是耕地面积增加较为明显的时期。中俄对比分析显示,黑龙江流域内中国部分的耕地面积远多于俄罗斯部分的耕地面积,1990—2000年中国部分的耕地变化的剧烈程度也远远高于俄罗斯部分的耕地变化,但后20年有明显减弱。从共同点来看,黑龙江流域内中俄两个区域耕地变化趋势均为先减少后增加,不同之处在于1990—2020年中国区域内耕地总面积减少,俄罗斯区域内耕地总面积略有增加。研究发现人口迁移、城镇化、土地改革以及资金短缺可能是耕地资源变化的主要原因,据此提出未来开发利用的建议。
图书馆由人、信息系统和物理系统(HCPS)组成。研究HCPS的内涵及各组成部分的关系,可为图书馆的发展指明方向。通过对早期图书馆、现代图书馆和智慧图书馆的特征分析,将HCPS理论引入图书馆中,并基于HCPS视角探讨了图书馆的演变过程,分析了不同阶段图书馆HCPS的特点与作用,提出了智慧图书馆HCPS的研究框架和重点研究内容,剖析了推动图书馆发展的赋能技术,进行了智慧图书馆HCPS的实践应用与讨论。信息系统的引入及发展助力了图书馆的演变,建立智慧图书馆HCPS的重点是开展信息系统模型的建立与仿真方法研究。初次探索HCPS在图书馆中的应用,提出的概念和研究框架仍处于探索阶段,后续需要广泛地跨学科合作与交流,不断充实和细化图书馆HCPS的研究内容、方法和技术。
随着科技的飞速进步,林草学科领域的研究日益倚重于大数据和尖端信息技术。这一趋势也带来了大量敏感且至关重要的科学数据,从而凸显了数据安全管理的重要性。本文首先概述了林草科学数据管理体系的五大核心组成部分:安全制度保障体系、安全组织保障体系、安全技术保障体系、安全运维保障体系和安全基础设施保障体系。这些体系共同构成了林草科学数据管理的坚实基础。其次进一步探究了基于分类分级的林草科学数据管理方案,并重点强调了数据安全防护体系的重要性。对不同类别的数据设定不同的管理级别,不仅可以促进数据的有序流通,还能确保数据在共享过程中的安全性和可靠性。这种精细化的管理方式,旨在保护数据安全的同时,实现数据的最大价值。最后详细列举了林草科学数据安全的防护措施,为林草科学数据的稳定增长与共享提供了坚实保障。
有机肥生产多以畜禽粪便原料为主,后者是抗生素污染土壤的重要来源之一。通过有机肥抗生素残留检测探究其对生态环境的影响,特别是“有机肥-土壤-农作物”的途径产生影响,对有机肥的安全施用具有重要意义。本数据集采集内蒙古不同地区包括羊粪、牛粪为主的畜禽粪便原料及以其为主要原料的商品有机肥共116份,其中有机肥原料74份,成品42份,进行4种四环类抗生素含量的检测以评估不同畜禽粪便及不同地区存在四环类抗生素风险的可能性,为地区有机肥的安全风险监测和评价提供依据。数据表明,原料土霉素检出率8.62%,四环素检出率10.34%,金霉素检出率10.34%,强力毒素检出率1.72%,商品有机肥金霉素检出率2.58%,强力霉素检出率0.86%,原料抗生素检出率均高于商品有机肥。
克鲁伦河流域生态环境安全直接关乎中蒙两国流域可持续发展水平,科学划分面源污染管控单元对于该流域实现水环境精准施策和高效管理具有重要意义。然而,当前该区域在污染管控方面缺乏有效的分区数据来指导具体施策。传统的污染管控单元划分方法,难以精确反映草原面源污染的差异性,从而在一定程度上影响了管理效果。草原面源污染受多重因素影响,其地理属性在属性上呈现出重复性,同时在空间分布上又表现出连续性。为了更准确地捕捉这些特征,需要一种能够平衡处理属性重复与空间连续的聚类方法。本研究针对克鲁伦河流域,面向草原面源污染影响因素,综合考虑了年平均降水、气温、数字高程、草地载畜强度以及土壤全氮磷含量等关键连续数据,利用能有效处理属性依赖关系和空间一致性策略的空间Toeplitz逆协方差聚类(STICC)方法进行聚类分析,构建了2022年克鲁伦河流域面源污染管控分区数据集。为了验证该数据集的精确性,采用DUNN聚类精度评价指标对该分区效果与其他传统分区结果进行了对比,结果显示:STICC方法在聚类精度上优于K-Means、Spectral K-Means、GMM及Repeated Bisection等方法,能够更有效地识别污染的异质性区域,进而显著提升管理的精细度。此外,本研究还保留了数据的原始连续性,使得对污染特征的刻画更为准确。相较于传统方法,本研究提供的分区数据在细节展现上提升了50%以上。该数据集不仅为深入研究克鲁伦河流域的面源污染特征提供了有力支持,还为相关管控决策提供了坚实的数据基础。
有机肥在农业发展进程中越来越受到人们的重视,在改善和提高土壤肥力同时可促进农作物优质和高效生产。有机肥含有丰富的有机、无机养分,对减少化肥施用有着不可替代的作用。在内蒙古东部、西部地区采集包括鸡粪、羊粪为主116份肥料,其中有机肥原料74份,商品有机肥42份。在有机肥原料羊粪、牛粪、鸡粪中检出重金属,其中1份羊粪样品铅超标,含量373.2mg/kg。商品有机肥均有重金属检出但未超标,除重金属锌外商品有机肥中重金属均高于原料,以羊粪为主生产的商品有机肥重金属含量高于羊粪和牛粪混合。内蒙古地区有机肥原料、商品有机肥整体情况较好。
食物浪费不仅导致大量宝贵资源的无效利用,更带来了沉重的经济负担,对社会和环境造成了深远的负面影响,已成为全球范围内不容忽视的议题。为了应对这一挑战,各国政府及民间组织开展了一系列旨在推动粮食节约的社会实践活动,并迅速获得了社会各界的积极响应。以开展光盘行动为契机,本数据集对光盘行动前后的个体就餐及食物浪费数据进行记录和保存,为研究食物浪费行为和干预措施对食物浪费行为的影响提供数据支撑。采用拍照编码法,通过为期四周的跟踪调查,本数据集收集了722位高校学生的个体特征数据以及16 976份食堂就餐数据。其中,个体特征数据涵盖了学生的个体及家庭特征、平时就餐习惯、健康饮食行为、食物浪费行为及对食物浪费的主观感知;就餐数据涵盖了每次就餐的餐次、食物构成、满意度、花费、共同就餐人数、是否吃饱以及食物浪费量等信息。所得数据均经过预调研及人工质量检验,数据处理均按照统一数据格式、剔除错误数据等规范化流程处理,以保证其科学性和准确性。本数据集为广大学者基于动态视角分析干预措施对食物浪费行为的影响研究提供数据支持,并为利用拍照编码法开展食物浪费行为研究提供了基础数据和实验范式。
粮食安全问题的风险因子众多,其中包括真菌毒素,过量摄入被黄曲霉毒素B1、玉米赤霉烯酮、赭曲霉毒素等污染的食品,将严重威胁人民群众的生命健康。本数据集为内蒙古呼和浩特、鄂尔多斯和乌海市3市的大米、小米、玉米共计510份粮食样品中黄曲霉毒素B1、玉米赤霉烯酮、赭曲霉毒素A的真菌毒素试剂盒检测结果数据。数据显示内蒙古主要粮食中黄曲霉毒素B1等三种真菌毒素的总体污染水平较低。本数据集可为试剂盒同时三种真菌毒素检测及与大型仪器设备数据比对深入挖掘分析利用提供数据支撑,还可以将其广泛应用于大型粮食交易市场、粮仓以及相关粮食监管部门以便实时、快捷地监督粮食的安全问题。
单一的组学数据难以全面揭示基因调控性状的复杂分子机制,整合不同类型和层次的生物组学数据对于理解生物体内复杂的分子网络具有重要的意义。本数据集提供了包含21个动物物种的61191个个体水平组学数据(WGS、RNA-Seq、ChIP-Seq和ATAC-Seq)和基因组注释信息,有效数据规模为2.8 TB。此外,本数据集还收录了基于深度学习算法得到的基因与表型实体识别数据。总的来说,该多组学数据集可用于农业重要性状的基因发掘和功能验证,能够为跨物种比较研究提供有价值的资源,也可更好地服务于动物经济性状关键基因识别模型构建以及算法研究。
中国在全球葡萄产业中占据重要地位,栽培面积和产量均居世界前列。作为果树产业的关键分支,葡萄产业对于农民的增收和乡村振兴起到了支柱作用。国外品种的引进和自主培育极大地丰富了我国的葡萄品种储备,为产业发展奠定了基础。但品种增多也带来了品种同质化及鉴定困难,传统的形态特征鉴定方法已不再适应当前的需求。本研究对291份鲜食葡萄种质资源提取DNA,利用30对荧光标记的SSR分子标记进行了PCR和荧光毛细管电泳检测,构建品种分子指纹图谱。本研究构建的分子指纹图谱数据库共包含8 730条信息,进一步分析表明,所选用的30个引物位点平均基因型个数为10.7个,杂合度范围为0.21到0.62,平均杂合度为0.38。依据30个引物位点基因型个数,216个品种被推测为二倍体,75个为多倍体,发现二倍体品种间的相似度普遍较低,而多倍体品种的相似度则相对较高。这项研究的成果不仅为葡萄品种鉴定提供了准确依据,而且为种质资源的亲缘关系分析提供了数据支撑,对葡萄产业理论研究和实际应用均具有重要意义。
精确获取流域范围内的植被覆盖度(Fractional Vegetable Cover, FVC),对于深入研究流域生态环境、湿地健康状况及其生态保护策略具有至关重要的意义。克鲁伦河流域是横跨中蒙边境的重要生态区,具有很高的生物多样性价值,对支撑并维护该区域生态系统平衡具有重要作用,鉴于此,本数据集以克鲁伦河流域作为研究区,基于10米空间分辨率的Sentinel-2多光谱遥感影像获取高精度植被覆盖度数据集,为流域生态环境保护提供数据支撑。为克服像元二分法、线性回归方法、随机森林回归模型等传统植被覆盖度反演方法在光谱特征间细微差异挖掘有效性与高维特征间复杂非线性关系发现不足等问题。为更精准估算该流域植被覆盖度,论文比较了基于深度学习的双向长短时记忆网络(Bidirectional Long Short-Term memory, BiLSTM)模型、随机森林回归、多层感知机与LSTM四个模型的性能以确定数据处理方法。所用特征数据以Sentinel-2多光谱数据为基础,综合光谱指数与高程数据,所反映植被相关信息包括叶绿素含量、水分状况以及地形地貌等。该特征数据集将进一步划分为训练集和测试集。比较结果表明,BiLSTM的R2和RMSE分别为0.716和0.103,综合性能最优。论文基于该模型生成了2022年克鲁伦流域的月度植被覆盖度数据集,包括12个月的克鲁伦河流域植被覆盖度反演结果组成,全部数据已经完成拼接和掩膜提取等操作。该数据集可用于评价克鲁伦河流域地表植被生长状况和生态系统健康状况,并为相关流域的生态保护研究提供支持。