土地规模经营是中国农业实现现代化转型的关键,但是现阶段面临土地流转增速放缓、适度规模化经营发展受阻等现实问题。江苏省经济发展水平较高,土地流转市场发育较为成熟,除了依靠市场机制运行,地方政府通过土地再调整、充当中介组织等方式创新土地流转形式,在推动土地连片规模化经营方面也发挥了关键作用。该数据集以2020-2022年中国土地经济调查CLES数据库为基础数据,按照规范化步骤整理形成943个地块、5923户农户和114个村庄3个数据集,数据内容包含土地利用和流转、规模经营信息。数据集为展现江苏省土地流转、规模化经营情况提供了可靠的经验证据,同时也为政府部门制定合理的政策干预提供了参考。
数据摘要:
通过信息技术提高农业生产的效率、优化农业生产中的问题对我国农业发展至关重要。目前,信息技术的发展产生了海量数据,这些数据大多以碎片化、非结构化的形式分布在网络上。尤其在农业领域,使用传统搜索引擎进行信息检索难以高效准确地获取其中有价值的农业信息,往往需要消耗大量的时间和精力从海量无组织的数据中进行二次收集和整理。针对上述问题,本文通过网络爬虫技术挖掘公开的农业网站中的数据,经过自动化或半自动化数据清洗、去噪等过程,将非结构化的数据重新组合成结构化的数据,最终以知识图谱的方式进行存储。所构建的农业知识图谱数据集包括粮食作物、经济作物、水果、蔬菜等11个农业大类、共计8 481个小类的条目数据,每个小类条目对应一种农业生物或药物。具体包括粮食作物461种、经济作物2 208种、水果1 294种、蔬菜257种、食用菌118种、花木1 161种、水产142种、农药113种、农作物病虫害1 605种、兽药519种、中草药603种。根据该数据集构建的农业知识图谱三元组达到90 508条,规模较大、覆盖品类较为广泛,能够为农业知识问答、推荐系统等人机交互友好的智能应用研发提供基础数据支撑;同时,在生成式大模型中融入农业领域知识图谱,有助于在垂直领域上实现更为高效、精准的信息检索和智能决策。
产业兴旺是乡村振兴的重中之重。农产品成本收益调查记录了农产品投入、产出、收益等情况,是政府部门进行宏观调控和价格管理的基础。新时代新征程,这套数据将在推进乡村振兴战略过程中发挥更大作用。很多学者基于该套数据分析我国农业投入要素使用、生产力、成本、利润等状况,但对数据库样本选择、采集过程、相关指标内涵等细节介绍有待加强。因此,本文收集了早籼稻、中籼稻、晚籼稻、粳稻、小麦和玉米等三种粮食2005-2017年31个地区的成本收益调查数据,形成数据集。本文重点对数据产生的背景、数据采集的方法、数据的主要内容以及数据的使用价值进行介绍。相关学者不仅可以使用该数据分析我国农产品的投入产出状况,也可以借鉴该数据的抽样方法、质量控制经验等。
本研究以中国农村电商实证数据为综述对象,按照电商定向干预和农产品交易地的特征将农村电商数据类型分为两类数据集。其中,数据集Ⅰ包括电子商务进农村综合示范县数据库、淘宝村与电商指数数据库;数据集Ⅱ包括农产品电商数据库与农产品跨境电商数据库。以此探讨不同数据集内若干农村电商研究主题所用数据的来源、指标内容、时间跨度、优劣势等内容,系统性梳理农村电商研究所用数据的来龙去脉,为该领域实证检验提供数据库筛选的参考,从而有效推动农村电商发展研究的理论进程。
为了解决人工智能(Artificial Intelligence)应用在地球物理参数反演中的“黑箱”问题,使得人工智能应用具有物理意义和可解释性及普适性,深度学习耦合物理方法和统计方法的理论和技术在各学科领域正在陆续展开。本研究通过梳理作者20余年的相关研究,在前面归纳和演绎得到人工智能地球物理参数反演范式理论和判定条件基础上,分别给出了遥感参数人工智能反演范式和判定条件。目前大家研究普遍遇到一个问题,很多人工智能参数反演理论模拟数据反演精度非常高,但实际应用反演精度不理想,因此深度学习如何耦合物理方法和统计方法成为当前亟须解决的工程与技术难题。我们以被动微波土壤水分和地表温度反演为例进行阐述,分析表明物理模型本身的精度还要很大的提升空间或者模拟数据只代表现实情况中的少部分情况。因此只利用物理模型模拟数据直接进行反演还存在很大的局限,必须补充大量高精度的多源统计观测数据。同时可以通过利用模拟数据对深度学习训练和用实际数据检验物理模型的误差。统计方法是人类最直观的描述,物理方法是对统计方法的归纳演绎总结,但真实世界的信息或能量传输是按量子形式传递,物理模型只是当前人们认识世界的最高形式,大部分模型并没有刻画好真实信息流。深度学习中的不同神经元更适合描述和表达量子信息的传输方式,以微积分量子能量信息流认识真实世界需要提高人类的思维认知方式,这才是最高模式。如何采集满足真实情况(量子信息或能量传输)的数据显得非常重要,当前可以充分利用物理逻辑推理构建物理方法和统计方法,并在范式理论和判定条件框架指导下利用大数据思维模式提高地球物理参数反演精度。通过物理逻辑推理证明输入变量能唯一确定输出变量是形成具有物理意义和可解释及通用的反演或分类或预测范式的基本条件,从量子信息(能量)传输真实角度控制采集数据质量是地球物理参数高精度反演工程与技术实现的关键,提高微积分量子信息流思维认知和甄辨物理模型的局限对实现人工智能高精度反演具有里程碑意义。
我国是世界范围内鸡蛋生产和消费的第一大国,鸡蛋也是我国居民膳食结构中主要的蛋白质来源之一,了解我国消费者对鸡蛋的偏好具有现实意义。本研究旨在了解中国消费者对鸡蛋的生产方式、认证标准和其他相关属性的偏好,以提供市场定位策略和科学依据,并为相关政策制定和饮食健康教育提供指导。问卷设计以离散选择实验设计为主体,结合对受访者相关食品安全知识的了解程度和人口学特征变量等数据的收集。最终课题组通过在线问卷平台收集到了全国30个省级行政区共1085份鸡蛋消费者样本数据,形成了2020年我国鸡蛋消费选择偏好数据集。数据集包括消费者鸡蛋消费过程中购买频率、购买来源,以及对鸡蛋价格、饲养方式、蛋鸡种类、食品安全认证属性的偏好等13个方面的内容。该数据集表明消费者对鸡蛋的生产方式、认证标准等属性有明确的偏好。这份数据集为我国禽蛋产品的消费偏好提供了基础数据,对于了解居民的消费习惯与偏好,保障国家食品安全,为食品企业制定市场策略,以及为政府科学制定决策提供了有力支持。
深度神经网络是棉花病害智能识别的一种重要方法。覆盖更多病害、土壤和环境信息的科学数据既是此类方法发展的基础,也是当前的关键制约因素之一。本文提出的棉花病害数据采集自中国海南省三亚市坡田洋高标准农田示范基地中的棉花种植田块,覆盖了炭疽病、细菌性角斑病、褐斑病和枯萎病四种常见棉花病害,包括3453张高分辨率的健康叶片和不同生长阶段的病叶图像。所有样品获取均采用田间随机采样方式,经筛选后由10名棉花病理学专家进行鉴定与标注,同时另选20名标注者对标注后图像进行随机重复标注以检测质量,Vision Transformer模型被引入以进一步验证数据集的稳定性。相对于其他同类数据集,当前数据集数据采集于复杂的田间环境,覆盖了常见棉花病害且具有高分辨率,可更好地服务于棉花病害智能识别模型、算法的研究、训练与验证。
以粗放型为主的漫灌方式浪费水资源,探索高效节水农业灌溉意义重大。本研究研制了集数据采集、数据管理、数据可视化、分析决策和远程管理为一体的智慧灌溉大数据管理平台,旨在以数字化管理与智能化控制方式提升水资源利用效率。平台利用嵌入式、物联网、互联网、3S(GIS、GPS、RS)等技术,采取“1+1+N”的设计模式,构建作物需水预报模型与灌溉决策模型,基于B/S构架和Java语言,设计了1个灌溉数据中心、1个灌溉数据管理系统、4个应用系统,打造了智慧灌溉大数据管理平台。平台在河北、河南、山东、江苏等地区设有多个示范基地,汇聚了8个科研小组、24个试验基地的有关多种作物的生长、灌溉、气象、土壤等数据,平均采集数据18829条/天,帮助管理人员摸清家底;集成了多个团队的软件系统和62套物联网设备,及时、定量地呈现了农作物生长状况及环境状态,实现了农作区动态监测,助力生产决策;生成农作物需水预报和灌溉决策方案,完成了远程灌溉目标,并且经过实地试验,验证了自动灌溉的有效性,将灌溉水有效利用系数最高提升了31%以上;形成了大田产业、温室中心、数字科研和区域灌溉等不同专题可视化布局,满足多种农业场景应用需求。为农业生产和跨区域管理提供了便捷工具,为农业灌溉数字化系统搭建和应用提供了参考。
随着眼动追踪技术深入发展,以及在行为经济领域的结合应用,目前在消费行为研究中结合眼动追踪技术进行探索分析已逐步成为主流。近年来,在食物消费行为领域结合眼动分析的研究迅速增长。其中功能性食品备受消费者关注,本数据集对消费者选购功能性食品过程中的眼动数据进行记录和保存,为研究消费者对功能性食品的消费偏好和购买行为提供数据支撑。本数据集利用眼动追踪技术开展选择实验,收集了151名消费者选购功能性纯牛奶过程中视觉注意力数据,涵盖总注视时长、平均注视时长、首次注视时长、注视频次、瞳孔直径5个维度指标以及最终购买决策,共755条数据,所得结果均经过人工质量检验,数据处理按照规范化步骤完成。本数据集为广大学者从行为经济学视角分析功能性食品消费的影响因素提供数据支持,并为利用眼动追踪技术开展功能性食品视觉营销提供了基础数据和实验范式。
准确高效地识别作物病害类型,有助于农户及时采取有效的针对性预防措施,从而降低因病虫害导致的减产风险和经济损失。然而,在其他领域能达到SOTA效果的识别模型,在农业领域特别是水稻病害识别的应用中,却面临目前已有的水稻病害数据量不足、种类不丰富以及数据质量不高等问题。本研究采用多种经典卷积神经网络,并利用迁移学习的方法在两个不同的数据集上进行训练。验证了除模型结构带来的优化外,训练数据集本身对于训练结果也具有重要影响。但目前农业领域开源数据较少,几乎没有综合性的数据开源平台可供利用。这一现象与高质量农业数据获取难度大且成本高、大多数从业人员教育水平相对较低、分布式训练系统不成熟、数据安全问题得不到保障等因素密切相关。针对农业领域训练中高质量数据缺乏的问题,在本文中提出了基于联邦学习框架构建农业数据共享平台的新思路。
国家农民专业合作社示范社是在国家层面上设立的示范组织,旨在推广和示范农民专业合作社的良好经验和做法,它由政府支持和引导,享受特殊政策和资源支持,并承担着示范引领的责任。构建国家示范社基本信息数据集可以为评估合作社扶持政策效果提供数据基础,在此基础上可以为政府制定新型农业经营主体高质量发展政策提供决策参考。该数据集以《国家农民专业合作社示范社评定及监测暂行办法》(农经发〔2013〕10号,以下简称“《办法》”)为依据,搜集整理了2014-2020年国家相关部委公示的国家农民专业合作社示范社名录,并为其匹配了入选、移出国家示范社名单的年份,以及成立年份、退出(注销、吊销)年份、所在地县级行政区划等信息,最终形成了囊括1万余家国家示范社基本信息的数据集,并在此基础上构成面板数据。通过该数据集,可以更好地了解不同地区优质农民合作社的生命周期和存续情况,深入分析合作社高质量发展的区域差异及其背后的驱动因素。
草原不仅是最大的陆地生态系统,而且也是生物多样性最为丰富的生态资源。草原监测是对草原生产要素及其动态变化进行系统地观测、监测和记录,旨在阐明其联系及发展规律。内蒙古大草原是目前世界上草原类型最多、保存最完整的草原之一,是我国重要的畜牧业生产基地。在草地生态系统中,土壤养分综合反映了土壤的基本属性和本质特征,研究不同草原类型土壤养分变化特征不仅反映植株群落对草原土壤健康的影响情况,同时为土壤、植被恢复形式、速度和方向等提供依据。目前,对土壤养分的研究多见于农业种植区域,草地土壤养分的研究数量较少。以内蒙古草地为例,相关研究主要聚焦于微生物多样性、温室气体等议题而鲜少涉及土壤养分,相关数据供给也非常有限。本数据集针对内蒙古自治区8个不同“区域-草地类型”草地在返青期、旺盛期与枯萎期的有效磷、速效钾、全氮、有机质、全盐以及pH值等土壤养分特征,所涉草地涉及温性草甸草原、荒漠草原、天然草滩、五花草甸草原和人工牧草种植地5种典型草原类型。数据集数据可为草地资源可持续利用研究与实践提供支撑。
南繁育种基地是我国农业育种的“加速器”,其战略地位十分重要。为了提高南繁育种基地农业数据采集效率、加强农田管理能力、满足大规模作物育种需求,亟需建设基于物联网的基地智慧管理平台。以海南省三亚市坡田洋基地为对象,开发了南繁育种基地物联网智慧管理平台。该平台部署传感器、视频监控、智慧灌溉等设备,开发了作物气象与土壤环境感知、视频监测、虫情监测等五大功能模块,可实时监测田间气象、土壤、虫情、孢子等环境信息以及作物生长状况,实现数据自动采集与智慧精准灌溉。平台的实时感知与智能预警功能,能够实现育种环境的远程监测与调控,为育种家提供智慧决策;通过智慧化获取作物表型信息,为育种家提供大量实验素材,显著提高育种工作的效率与精准度,为大规模田间作物育种提供技术支撑。在未来,依托人工智能、机器人和无人机等现代技术,以作物表型数据智慧化获取代替人工表型测量,以作物加代繁育智慧化管理代替人工管理,以优良品种的智慧化评估与筛选代替经验丰富的育种家,实现南繁育种基地的天空地一体化,助力大规模田间育种的智慧化数字化发展。
传统基于时序遥感影像的水稻物候期特征提取方法要求有较高的时间分辨率,受成像条件制约而较难满足;由于不同水稻种植区域环境条件不同,基于单一影像的深度学习水稻种植区域提取方法泛化能力较差。本文选取时相相近的光学和合成孔径雷达(Synthetic Aperture Radar,SAR)数据,削弱水稻种植区影像时空信息差异。通过泛时空特征融合有效地利用光学数据空间特征信息和SAR数据后向散射信息,采用双结构网络模型提取水稻特征。实验表明,基于多源数据融合的泛时空特征水稻深度学习提取方法在三江平原和肥西县水稻数据集上训练模型验证集总体测试精度为95.66%,Kappa系数为0.8805。该模型在南昌市区域水稻提取结果与实际地块边界符合较好,总体提取精度为86.78%,证明了泛时空特征模型的泛化能力和实用性。
农作物图像在进行目标检测时,由于作物种植较密集、成像质量不佳等原因严重影响目标检测算法的检测精度。针对存在的问题,提出一种基于YOLOv3的改进算法优化在农作物目标检测的检测性能:对YOLOv3的主干特征提取网络进行优化,利用原网络中输出的4倍降采样特征图对目标进行检测,并且在算法原网络残差块的基础上增加残差单元,以检测目标较小的农作物位置信息;提出高斯衰减函数,对图像中高度重叠的农作物候选框的衰减较强,在有效抑制冗余框的同时也可以有效地降低漏检率;对回归损失函数进行优化改进,用CIOU Loss作为损失函数,使得目标检测过程中最终的目标定位更加精确。将改进的 YOLOv3算法和原 YOLOv3 算法、Faster R-CNN 算法在实拍的玉米作物图像数据集上进行对比实验,结果表明改进后的YOLOv3算法能有效检测农作物小目标,算法检测的平均准确率均值和检测速度都有明显的提升。
随着大数据和机器学习技术的进一步发展,处理具有几十上百维特征的复杂结构和关系且蕴含丰富语义信息的高维数据成为一项挑战。在保障个人隐私不被泄露的前提下,如何安全地使用这些高维数据,成为当前的一个重要话题。我们查阅资料发现:关于差分隐私技术本身的综述很多,但是面向高维数据发布的差分隐私算法及应用的综述却很少。基于此,本文通过对差分隐私在高维数据领域的应用进行综述,深入了解不同方法在保护高维数据隐私方面的优劣,并指导面向高维数据发布的差分隐私算法未来研究的方向,从而更好地应对隐私保护和数据分析的挑战。本文首先介绍了差分隐私的原理和特性,总结了当前差分隐私技术本身的研究工作。然后从数据降维和数据合成两个角度分析了差分隐私在高维数据环境中的应用,探讨了差分隐私面临的问题和挑战,并提出了初步的解决方法,旨在更好地解决当前高维数据保护和使用的问题。最后,本文提出了未来可能的研究方向以促进技术交流,推动差分隐私在高维数据应用中的进一步突破。
县域在我国经济发展和乡村振兴中具有关键地位,也是数字乡村建设的主阵地,数字乡村的建设反过来也是促进县域经济发展和提升农民收入的重要动力。当前我国县域数字乡村建设存在发展基础较差、城乡与区域发展不平衡、缺乏建设运营和数据共享机制、资金和人才不足等问题。农业农村大数据资源与大数据平台是建设、发展数字乡村的重要基础,也是数字乡村顶层设计的重要组成部分。在此背景下,本文提出“5+N+N”的县域数字乡村建设总体思路,即构建一个农业农村大数据资源目录、开展一次县域数字乡村发展评价、制定一个数字乡村发展总体规划、搭建一个数字乡村综合服务平台、建设一个区域数字农业产业示范基地/数字治理示范村镇,和拓展N个数字乡村应用场景、实施N项数字乡村支持工程。在实施层面,通过政府、企业、科研单位的合作,向上连通国家、省、市各级数字经济管理平台,向下打通乡镇、村庄的数字管理应用,实现对县域数字乡村建设水平的全面提升。该框架体系为县域数字乡村发展的顶层设计提供了新的思路,有利于县域依据当地情况制定数字乡村实施路径,推动县域经济数字化转型。
随着社会经济发展和收入水平的提升,中国大部分居民营养健康状况明显改善,但农村地区仍面临营养不足与过剩并存、膳食结构不合理、营养疾病多发等问题。因此,文章以陕西省为例,分析了陕北、关中、陕南农村居民在食物消费与营养健康方面差异,旨在探索三大区域健康膳食模式及有效干预措施,为解决农村居民营养失衡提供重要参考。采用多阶段分层随机抽样方法进行微观调研,共发放问卷540份,有效问卷530份,有效率高达98.14%。本次调查以电子版问卷为主,以纸质版问卷为辅,采取入户一对一现场深度访谈的形式开展。调研问卷主要包括村庄和家庭基本情况、居民年收入及支出、居民食物消费、食物网购、身体健康状况及医疗支出等信息。综上,陕西省农村居民食物消费与营养健康数据集的共享,为改善居民食物消费结构,促进膳食营养提供了数据支持,助推了食物消费升级和营养健康转型。
加快建设农业强国,推进农业农村现代化,离不开对我国农业农村现代化现状的观察和调查。通过跟踪调查可以深入了解我国农业农村现代化的发展过程与现状,更有针对性地支持国家和地方实施乡村振兴战略的科学决策和支撑“三农”问题的前沿学术研究。本文作者以华中农业大学经济管理学院和宏观农业研究院连续5年组织的农业农村现代化跟踪调查为例,围绕调查前的准备与人员组织、调查中的制度保障与规范化工作以及调查后的总结与维护,系统地概述了跟踪调查过程中各个环节的组织和开展过程。
在数据急剧增长的信息时代,网络技术的快速发展给传统问卷调查带来新挑战。电子问卷调查系统崭露头角,其被广泛应用到多个领域。本文以世界银行开发的Survey Solution电子问卷调查系统为例,全面介绍Survey Solution电子问卷调查系统特点,系统组件和功能,数据质量控制和核查方法,探讨Survey Solution系统的应用价值和使用建议。Survey Solution系统具有获取各种数据、严格调查数据质量、支持多种调查模式、安全且灵活的特点。Survey Solution系统主要组件包含总部系统(Headquarter)、问卷设计器(Designer)、调查软件(Interviewer)、主管(Supervisor),不同组件间协同工作,分别负责和实现不同的任务和功能,为数据收集和调查提供全面的支持。Survey Solution系统具有高质量数据收集、多样性的数据收集方式、实时数据监控和管理以及定制化数据处理和报告等应用价值。在使用Survey Solution系统时,要详细规划调查任务、培训调查员和主管、定期备份数据、使用数据分析工具以及及时解决问题,利用好Survey Solution提供一系列资源,最大程度地提高调查效率和数据质量。
数字孪生被视为智慧农业新的发展阶段。通过建立农业生产的物理系统和数字空间,数字孪生技术实现了“连接-感知-决策-控制”一体化,可以通过更高水平的智能控制应对农业生产系统的复杂性。我国农业数字孪生系统发展相对较晚,相关研究与技术装备整体处于探索和起步阶段。本文基于奶牛养殖多维信息采集、数据分析和生产仿真模型的研究,面向饲喂管理、繁殖管理、健康管理和环境调控等关键生产场景,建立奶牛场在虚拟空间的数字化映像,构建了奶牛养殖数字孪生系统,实现了对养殖技术流程与生产装备的数据驱动、实时反馈、模拟推演和以虚控实的智能管控,并在江苏省某千头规模奶牛场进行了具体应用和初步验证。
农产品质量安全关乎民生健康,也是保障粮食安全的重点之一。三亚市是我国热带典型的岛屿型国际旅游城市,具有得天独厚的农产品种植与贸易条件,同时也隐藏着农产品质量安全风险。“三品一标”坚持发展安全、高品质、生态的农产品,持续发展“三品一标”有助于提高农产品质量安全水平。为了了解消费者对“三品一标”的关注程度,充分发挥“三品一标”对于农产品质量安全的辅助作用,本文以微信小程序、入户调查等方式,向三亚市消费者发放调查问卷,并基于调查数据对多个影响因素开展相关性分析。结果表明,消费者的年龄、年收入水平以及农产品购买频率与“三品一标”的认知水平呈正相关关系,三亚市消费者对农产品的质量安全有一定的了解,但是对于“三品一标”和追溯系统的关注度不够。
总结国内外个性化学术文本检索的研究现状,为后续个性化学术检索的研究提供思路借鉴和前景展望。搜集国内外相关文献共计154篇,采用文献分析法归纳出个性化学术文本检索研究框架,并对核心研究与辅助研究点进行详细论述。国内外个性化学术文本检索相关研究已逐渐系统化,从理论研究走向理论与实践研究并举,目前存在低负担高隐私的交互方式尚未实现,面向认知要素的深层次个性化检索尚未实现及适用情境识别的前置研究缺失等研究问题。积极拥抱大模型等新技术赋予的能力,走向认知化、嵌入情境式及实时交互式是个性化学术文本检索的未来发展方向。
随着我国肉牛规模化设施养殖模式的逐步普及,对牛只的精细化甚至智慧化管控已提上议事日程;同时,物联网、大数据、人工智能(AI)甚至大模型的快速发展正不断渗透到各行各业,使得对包括传统养殖在内的智慧管控也成为可能。本研究以阳信亿利源5G数字化牧场为研究对象,集成应用智能电子耳标及智能项圈,以及包括温湿度、氨气、二氧化碳、风向风速、光照及空气质量(H2S,PM2.5,PM10,TSP)等多种环境传感器。同时进行全面动态感知牛只个体的生理指标如运动量、反刍量等,并通过对上述2个重要的生理指标的分析,判断繁殖母牛的发情情况并预测最佳的配种时间,或通过监测牛只反刍量的变化,判断饲料的调整是否合适;全面感知牛舍包括温湿度及空气质量指标,为牛舍的精准通风及环境质量的精准控制提出数据支撑;并采用MY SQL数据库技术及DELPHI语言进行相关数据的分析。本研究构建了集养殖环节关键数据自动采集、数据的自动转换计算、数据的有线及无线传输、数据的远程贮存及处理控制为一体的物联网管控平台,实现了对肉牛养殖环境、健康状态、防疫及饲料调度等数字化管控平台。随着系统不断运行与迭代、养殖过程数据维度及数据量的不断积累与拓展,基础数据及派生数据的挖掘及升值空间越大,将为建立肉牛养殖的大模型奠定基础。
科学数据是战略性、基础性科技资源,深刻影响着各国的国家安全、经济发展和科技进步综合竞争力。在开放科学背景下,科学数据作为数据密集型科学研究范式的成果及重要支撑的同时,也面临着安全合规、可信可靠共享方面严峻的安全挑战。笔者从我国科学数据共享面临的安全挑战出发,以促进科学数据开放共享为目标,以构建动态、细粒度、领域适用的数据分类分级制度为核心,从政策、管理、技术、评估和监管等方面,提出科学数据安全战略,促进科学数据安全开发利用,实现科技强国的目标。
在现代信息社会,数据隐私保护成为公众关注的焦点。随着互联网用户对个人信息安全的日益重视,信息检索领域的隐私保护研究变得至关重要。隐私保护关键词检索技术旨在在不泄露用户查询意图的情况下,提供安全、保护隐私的检索服务。尽管现有技术在满足基本需求方面取得了进展,但如何在保持效率的同时减少隐私泄露风险,仍是一个挑战。为此,本文对隐私保护关键词检索技术进行了详细回顾,系统地分析了当前主流技术的原理、优势与不足。研究发现,尽管已有技术能够对用户查询进行加密处理,防止敏感信息直接泄露,但在查询模式、访问模式与返回结果之间,仍存在着潜在的隐私泄露风险。针对这一问题,本文提出了一系列改进方向,以增强隐私保护的效果。此外,当前的隐私保护技术在实际应用中面临诸多挑战,这些挑战涉及技术增强、隐私合规等多个方面。通过对隐私保护关键词检索相关前沿技术的融合与创新,有望为解决这些技术问题提供新的思路和方案,推动隐私保护技术向更高水平发展。本文最后对隐私保护关键词检索技术的未来发展方向和创新应用模式进行了展望。
随着互联网的普及,农业知识和信息的获取变得更加便捷,但信息大多固定且通用,无法针对具体情况提供定制化的解决方案。在此背景下,大语言模型(Large Language Models,LLMs)作为一种高效的人工智能工具,逐渐在农业领域中获得关注和应用。目前,LLMs技术在农业领域大模型的相关综述中只是简单描述,并没有系统地介绍LLMs构建流程。本文重点介绍了农业垂直领域大语言模型构建流程,包括数据采集和预处理、选择适当的LLMs基模型、微调训练、检索增强生成 (Retrieval Augmented Generation,RAG)技术、评估过程。以及介绍了LangChain框架在农业问答系统中的构建。最后,总结出当前构建农业垂直领域大语言模型的一些挑战,包括数据安全挑战、模型遗忘挑战和模型幻觉挑战,以及提出了未来农业垂直领域大语言的发展方向,包括多模态数据融合、强时效数据更新、多语言知识表达和微调成本优化,以进一步提高农业生产的智能化和现代化水平。
森林是陆地生态系统的核心部分,其生物量约占陆地生态系统总生物量90%,承担着65%以上的年碳固定量,在维持全球碳平衡、减缓温室气体增加等方面具有重要作用。天山云杉是新疆地区重要的林木资源,其种植覆盖面积为75 8600 hm²,占新疆维吾尔自治区天山区域总面积的42.33%,蓄积量为0.17 km³,占总蓄积量的50.66%,构建其生物量时空数据集,可为新疆维吾尔自治区天山区域碳固存潜力评估和天山云杉林保护与可持续经营实践提供科学依据。数据集以2002年、2007年、2012年和2017年天山云杉密集区野外样地调查和相关多源遥感影像资料为基础,利用时空地理加权回归(GTWR)模型拟合生成各时期生物量分布图。该数据集有助于探索天山云杉生长趋势和生物量变化,同时在新疆天山地区生态保护和气候变化研究领域具有科学价值,对区域生态系统管理具有实践意义。
在数据安全和隐私保护日益重要的背景下,零知识证明(Zero-Knowledge Proofs, ZKPs)为保护隐私提供了强有力的工具,成为最具应用潜力的核心技术之一。本文综合探讨了零知识证明技术及其在区块链中的应用。首先,详细介绍了零知识证明的相关概念以及三种典型的技术,对ZK-Snarks进行了深入探讨,并讨论了ZK-Stark和Bulletproofs等其他证明机制,深入对比分析了各自的设计、技术特点、性能和应用场景的差异。在此基础上,重点介绍了ZKPs在区块链环境下的应用,并分析整理了编写零知识证明的相关工具,这些工具在提升具体应用的性能方面尤为重要。最后,指出了一些潜在的问题和未来的研究方向。
食物消费是居民获取日常营养的重要渠道,同时也是人们维持生存、保持健康的基本需求。经济的发展促进着农村居民食物消费的转型升级,同时也改变着农户的营养健康状况。对我国农村食物消费与营养摄入情况进行调查,是引导科学的饮食结构、提升农户营养健康水平的关键,同时也为农村居民食物消费的机理研究提供了重要的微观数据资料。数据集来自黑龙江省,数据主要通过入户问卷调查的方式采集。问卷内容覆盖了个人情况、膳食回顾、食物消费、健康情况与体力活动、营养认知及素养等信息,并经预调研及专家讨论进行修订以保障其科学性。入户调查活动于2022年7-8月开展,作者走访了黑龙江省6个县(市/区)18个乡镇中的543名农户,所得数据采用自查与互查的方式进行人工质量检验以保障数据的真实性及准确性。调查数据均按照统一数据格式、剔除错误数据、合并重复数据等规范化流程处理。本数据集提供了多地区微观调研信息,可为农村食物消费与营养摄入的异质性研究提供数据支撑。
核农学是核科学技术和农业科学技术结合发展而成的交叉学科,对我国改造和创新传统农业产生了深远影响。整理国内现行核农学标准信息有利于研究核农学标准体系,开展重要标准制修订工作,支撑核农学科研活动和产业发展。核农学标准数据集基于全国标准信息公共服务平台公开的标准信息和文本,通过检索和提取,汇集了国内现行有效的146项核农学标准的主要信息,包括中文名称、英文名称、标准编号、标准级别、发布日期、实施日期、CCS分类、ICS分类、摘要、适用范围、主编单位、参编单位、主要起草人、归口单位、采标情况、所属专业领域等数据,可为核农学标准化工作提供数据支撑。
土壤盐渍化已成为限制农作物产量与质量的重要因素之一,影响着全世界范围内的农作物产量。苹果作为一种重要的水果作物,盐胁迫的危害及耐盐砧木的缺乏已成为威胁现代苹果产业健康可持续发展的重要问题。因此,研究苹果对盐胁迫的反应和适应具有重要的现实意义和紧迫性。本研究分别以0%、0.2%和0.6% NaCl处理0、4、8和12天后的珠美海棠实生苗为试验材料,从叶片及根系中提取总RNA,构建RNA-seq文库,共鉴定获得575个miRNA,包括315个已知mdm-miRNA和260个新miRNA。此外,Differential Expression(DE) miRNA对盐胁迫反应具有组织特异性表达模式。同时提供珠美海棠miRNA深度测序的数据集,结合生物信息学方法对原始数据质量控制,获得高质量序列并利用BLAST软件将预测靶基因序列与NR、Swiss-Prot、Pfam等数据库比对,获得响应盐胁迫相关基因的注释信息。GO分析表明与盐胁迫有关miRNA及靶基因主要参与生物过程中对刺激的反应。本研究为珠美海棠的利用提供理论数据基础,并为耐盐砧木的选育提供有力支持。
随着人工智能和材料科学数据驱动的材料设计热潮的兴起,材料科学数据成为生产要素、国家战略资源和国际竞争的焦点。然而,随着材料数据共享的增加,数据安全问题变得不可忽视。数据泄露、滥用、篡改等问题威胁着企业竞争力。本文综述了目前主流的数据安全保护技术,包括访问控制、加密技术,构成了传统的数据安全防护模型,实现数据传输、存储时的安全。区块链技术可以实现数据传输、存储时的机密性、完整性、可用性,但是这些机制仍无法解决数据使用时的隐私问题,无法保护使用中的数据机密性、完整性等问题。利用机密计算技术的优势,在硬件可信执行环境中执行计算,最小化计算环境的可信基,提供全方位的数据保护,践行“数据可用不可见”理念,实现对使用中的数据保护,进而构建端到端的全生命周期数据安全。本文结合区块链和机密计算技术的优势,提出基于区块链和机密计算的材料数据可信基础设施方案,以实现数据的全生命周期安全,为材料数据的安全应用提供有力支持。
鄂托克前旗位于内蒙古自治区西部的鄂尔多斯市,由于其特殊的地理环境,形成了种植业与养殖业并存的农业生产模式。课题组对鄂托克前旗的4个镇30个村(嘎查)开展了问卷调查,收集了2022年当地农户个人及家庭的基本情况、农户的种养殖业生产经营状况、农业机械使用情况等方面的数据。形成了2022年内蒙古鄂托克前旗种养生产调查数据集,包含451个样本和163个变量。该数据集为研究种养循环情况、农业机械的投资和使用情况等提供了支撑。
信息化时代,科技创新越来越依赖于科学数据。随着国际竞争形势愈发严峻,科学数据安全与出境管理问题日益凸显。当前,我国科学数据出境管理存在政策法规不完善、技术能力不够、国际合作机制不完备等问题,亟须完善相关管理制度,建立协调统一的科学数据出境管理体系;加强数据安全监测与监管技术研发,推动科学数据关键技术创新升级;积极探索双边多边国际科学数据合作,引领国际科学数据规则框架制定。与其他国家一起共同应对科学数据出境中的风险挑战,推动全球科学数据安全、有序流通,加速科技创新发展。
农村大规模实地微观调查是人们认识和研究农村社会经济的重要手段和方法。随着乡村振兴战略的不断推进,实施农村大规模实地微观调查有利于我国准确判断农村经济发展阶段,更好地认识农村经济发展面临的机遇和挑战。本文中主要介绍了农村大规模实地微观调查的组织要点和资料管理,从物资准备、进村入户、“找对人”、“做对表”以及问卷检查五部分详细阐述了正式调查的主要内容,并详细说明了调查问卷整理与装档、调查日志记录、工作照整理归档、财务记录整理、物资回收与处理及更新调查员数据库等调查资料管理的重点环节,以期为相关研究人员更好开展农村大规模微观实地调查提供经验和启示。
茶叶是世界三大无酒精饮品之一,在我国有悠久的种植历史和广布的种植面积,贵州省投产的茶园有46.67万公顷,位居我国各省区投产茶园前茅,如何高效安全地控制茶园害虫,提高茶叶的产量和质量,一直是广泛关注的热点。利用天敌控制害虫在茶园虫害防控中得到了普遍应用。独栖蜂是茶园生态系统中一类重要的捕食性天敌,而且部分独栖蜂兼具传粉功能,在生态系统中起到独特的作用。人工巢穴技术(管巢法)利用独栖蜂在巢管中筑巢的特性,采集到的样本均是在当地生态系统生活与繁殖的物种,因此采集到的数据能更直接地反映出当地的生态条件,但是该方法周期较长、成本较高,可利用数据较为有限。本数据集利用人工巢穴技术收集了贵州省湄潭、久安、都匀三个主要茶叶产地生态茶园内原生境独栖蜂,内容包含了2021年在以上三地收集到的独栖蜂种类、数量、取食对象、筑巢习性、发生规律等相关信息。本数据集可为明确贵州省茶园独栖蜂种类及优势类群、并进一步研究其种群动态与生防潜力等提供数据基础。
科学数据共享程度加大、国际形势复杂多变、信息技术突飞猛进,国际合作中的科学数据安全问题日益凸显,科学数据安全工作面对挑战。本文在厘清科学数据安全内涵的基础上,以代表性国际科技组织和大型国际科技计划为例,剖析典型国际科技合作中的科学数据共享安全治理政策与实践,为我国制定相关政策提供参考借鉴。因此,建议应继续遵循“开放为常态、不开放为例外”理念,灵活运用“例外”和“豁免清单”在义务和权利间取得平衡;进一步完善国内科学数据安全治理政策体系,及时掌握国际科学数据政策动态,提高国际科技合作中的科学数据政策透明度与合规性;综合考虑科技数据资源、风险管控技术等因素,实施真正意义上的对等交换;培养精通国际政策法规和行业惯例、技术布局全面的数据安全保障团队。
铜陵牡丹(凤丹)是近年来得到普遍关注的新兴油料作物。研究牡丹籽的营养成分及其流失规律,不仅是铜陵牡丹种植和加工产业的基础性需求,而且对其药用、食用等相关产业的发展也具有重要意义。传统上相关研究数量较少,可供使用的研究数据更为稀少。本文主要以铜陵道地产区和亳州主产区的特色牡丹的成熟种子为样本,综合运用索氏抽提法、紫外分光光度法、气相色谱法和氨基酸测定法等方法,测定了不同产地与贮藏时期种子的粗油、总蛋白、脂肪酸组成及16种氨基酸等营养成分含量。本数据集初步给出了不同产地与贮藏条件下牡丹籽的营养成分,对于牡丹种子发芽、籽粒加工和合理贮藏具有直接的学术参考价值。
在当前信息化高速发展的背景下,智慧农业作为农业发展的必然趋势,其中农业大数据是实现智慧农业的重要支撑。尽管农业大数据带来了巨大的产业动能,但也伴随诸多的数据安全问题,有效处理农业大数据技术与数据安全的关系显得至关重要。首先综合分析当前各种观点重新定义了农业大数据,然后通过案例详述了其在农业供应链各环节中的促进作用,接着深入剖析了农业大数据的泛在性、社会性、交叉性等专有特征。最后,基于安全三项基本要素(机密性、完整性和可用性)以及农业大数据的专有特征,从数据采集、数据传输、数据存储等大数据生命周期的七个阶段出发,构建了智慧农业场景下的大数据安全风险框架。从大数据存在的共性问题引出农业领域下基于专有特征的特性问题,并结合实际智慧农业场景,提出了有针对性的安全解决策略。本文将对未来研究智慧农业领域中数据安全问题的解决方案提供新思路,旨在促进智慧农业更快更安全发展。