常见问题


  • 一、 数据论文与研究论文的区别是什么?
    二、 《农业大数据学报》出版哪些数据?
    三、 向认证仓储提交数据库(集)是否是出版的前提条件?
    四、 《学报》是否只出版完全开放共享的数据库(集)?
    五、 《学报》是否出版整编数据?
    六、 《学报》是否出版已发表研究论文的支撑数据?
    七、 《学报》是否只出版科学数据?
    八、 《学报》是否出版集体创作的数据?
    九、 当已出版数据更新时,是否应发表新的数据论文?
    十、 数据论文的作者及其排名是否必须与数据集保持一致?
    十一、 如何拟定数据论文的题目?
    十二、 如何选定数据论文的关键词?
    十三、 如何撰写数据论文的引言?
    十四、 如何确定数据论文的作者贡献类型?


    一、 数据论文与研究论文的区别是什么?
      回答:数据论文描述数据,促进数据理解和使用;研究论文论证和生产知识,推动知识发展。
      进一步的说明:
      数据论文的主体内容是对数据库(集)准确、全面和规范的描述,以及以此为基础的数据使用说明和价值揭示,其目的是促进数据库(集)的准确理解、重复利用、广泛传播和持久存档。研究论文的核心是新知识产生及其学术影响的逻辑论证,其目的是推动新知识的学术研讨、传播和记录。
    数据论文与研究论文均涉及研究数据,并因此形成既相互补充又有所区别的关系。绝大部分研究论文以研究数据作为论证依据,并据此对数据的来源、产生方法与内容等进行必要但有限的说明。相对而言,数据论文更为全面、详细与充分地说明相关数据的证据性,重点是数据的可复现性与可靠性。在这一意义上,数据论文对研究论文发挥了强有力的补充作用。此外,数据论文同时增加了数据权属、数据有效性、数据用途与价值说明等数据共享和利用所需的信息,从而推动了数据的理解和共享。
      在操作层面,数据论文与研究论文主要存在3点关键差异:
      (1)数据论文的主体内容是对数据产生及其内容的说明,其中不涉及任何假设的提出和验证,后者是研究论文的主体。
      (2)研究论文中可能存在对支撑数据的有限描述,包括数据的生产、描述性分析和验证,然而更主要的是以知识发现为目的的探索性或预测性数据分析。数据论文中必然存在更加完整、详细与规范的数据生产与验证说明,在大部分情况下,也存在以数据理解为目的的描述性分析,但不会出现任何以知识发现为导向的数据分析。
      (3)研究论文一般不会涉及数据权属、数据可用性等事关数据共享的内容,往往也不会讨论数据的使用潜力与价值,这些都是数据论文的必要内容。

    二、 《农业大数据学报》出版哪些数据?
      回答:《农业大数据学报》(以下简称《学报》)以数据论文形式出版各类面向农业农村、产权清晰且可共享的原创性数据。
      (1)面向农业农村意味着该数据可用于农业农村领域及相关学科的科学研究、决策与产业应用。
      (2)产权清晰是指数据生产者身份与数据权属明确无疑义。
      (3)可共享包括完全公开共享和受限共享两种情况,具体参见下文“四、《学报》是否只出版完全开放共享的数据库(集)?”。
      (4)原创性是指数据生产者对数据产生具有实质性贡献且该数据未以数据论文形式公开发表。

    三、 向认证仓储提交数据库(集)是否是出版的前提条件?
      回答:绝大部分情况下是。
      (1)投稿至《学报》的数据论文必须提前将相关数据库(集)存储至学报指定的两个公共数据仓储:“农业农村科学数据仓储(https://agri.scidb.cn/)”或“国家农业科学数据中心在线数据汇交(https://a.agridata.cn/)”。其中,涉及受控共享的数据(参见“《学报》是否只出版完全共享的数据库(集)?”)只能提交至后者。
      (2)《学报》原则上不接受作者自存储数据库(集)的投稿。
      (3)《学报》可接受非认证但重要、知名公共数据仓储(例如,NCBI)的数据提交,前提是该仓储符合以下条件:
      l 数据仓储满足“可信数据仓储(TDR)”的认证要求。
      l 数据仓储具有数据库(集)撤销的审批与存证机制。
      l 数据仓储支持受控访问与私有链接。

    四、 《学报》是否只出版完全开放共享的数据库(集)?
      回答:大部分情况下是。
      学报更倾向于接受完全开放共享的数据库(集),然而以下两类受控共享的数据库(集)也会得到出版。
      (1)具有保护期的完全共享数据库(集)。在具有充分理由的情况下,学报接收作者出于学术优先权保护、时间敏感性内容保护等考虑的保护期申请。数据保护期为1-5年不等,数据在保护期内按照作者拟定的《数据访问协议》进行有条件的访问、使用与传播,保护期失效后完全公开。
      (2)受控共享的数据库(集)。学报接受因隐私保护、伦理保护而必须有条件共享的数据,以及少数因合理的学术优先权或商业利益保护而无法完全公开共享的数据。读者或数据用户需按照作者提出的《数据访问协议》,在特定条件下进行数据访问、下载、使用与传播。

    五、 《学报》是否出版整编数据?
      回答:不完全是。
      整编数据是对一个或多个基础数据(包含整编者生产的数据)进行编辑而形成的新数据库(集)。只有当整编数据具有了不同于基础数据的新价值,或者说,整编数据是基础数据的“化学反应”而非“物理反应”结果时,此类数据才被《学报》认为具有出版价值。
      典型的“物理反应”包括机械性的数据处理/拼接、已有数据记录的小幅度调整等;典型的“化学反应”包括基于新变量(或新指标)整合一个或多个基础数据源,或者在基础数据上附加自主生产的数据从而形成新的学术价值或用途等。

    六、 《学报》是否出版已发表研究论文的支撑数据?
      回答:是的,而且和绝大部分国内外数据期刊一样欢迎此类数据。
      一般而言,作者将在数据论文中增加更多的数据描述信息,这些信息一般是研究论文限于篇幅而无法详细说明的内容。例如,更详细的数据生产与验证说明,或者更深刻地揭示数据的潜在用途与价值。新增信息或说明提升了数据的可理解性和复用可能性,由此与相关研究论文形成了良好的互补关系并推动后者的发展。

    七、 《学报》是否只出版科学数据?
      回答:不是。
      学报出版包括科学数据在内的各类型数据,包括但不限于研究数据、基于公共数据形成的整编数据或数据产品、可开放的商业性数据和公民科学数据等。

    八、 《学报》是否出版集体创作的数据?
      回答:是的。
      《学报》出版机构、组织产生的长期观/监测数据等集体创作数据,前提是此类数据以集体作者署名、具有适当的作者贡献和致谢声明、具有出版授权声明且公开共享。

    九、 当已出版数据更新时,是否应发表新的数据论文?
      回答:《学报》仅在以下两种情况出版新的数据论文,其他情况将刊发版本更新公告。
      (1)数据生产的方法(包括样品制备、采集方法、验证方法等)发生了重大改变,因而需要予以专门说明。
      (2)数据内容发生了显著改变,包括增加了数据指标且显著增加了数据记录。

    十、 数据论文的作者及其排名是否必须与数据集保持一致?
      回答:不一定。
      数据论文的作者包含数据库(集)的创作者,反之则不尽然。数据论文的作者及其排名需要根据个人对数据库(集)与数据论文的贡献综合确定。

    十一、 如何拟定数据论文的题目?
      数据论文的题目需准确反映主题且简短、醒目,中文题目最多不超过50个字,英文题目不超过100字。题目可由一个主语和多个修饰或限定语组合而成。
      l 数据类型,是数据集的主语。例如,基因组、地图、观测数据、结构、本体、指数、编目数据、光谱库、引文数据、语料库等
      l 数据来源,是数据集的限定语。例如,观测、近实时监测、调查、模拟、实验等
      l 数据主题或数据对象,是数据集的限定语。例如,硝酸盐测量、土壤有机质、视觉等
      l 数据特征,是数据集的限定语。例如,逐日、三维、高分辨率、高寒区域、二十年期、1895年年以来等。其中,涉及特定年代的可在括号内标识,例如,“...数据(1872-1974)”
      l 数据用途,是数据集的修饰语。例如,支持全球变化研究、更好理解森林生态系统等。
      l 数据方法,是数据集的限定语。例如,使用融合方法生成的(XX数据)。
      作者可选择上述最能表征数据库(集)的要素组合使用,比较典型的题目示例为:
      l 澳大利亚土壤中有机碳含量的基线高分辨率地图
      l 通过非线性物理方法外推的三维太阳磁场大规模数据集
      l 自1850年以来二氧化碳、甲烷和一氧化二氮的历史排放对气候变化的国别影响
      l 一个反映住宅环境中日常生活活动的多传感器数据集
      l 英格兰西南部Perranporth海滩和Start湾的沿海调查数据(2006-2021)。

    十二、 如何选定数据论文的关键词?
      关键词宜精要概括数据库(集)的主题、内容、数据对象、数据方法、数据特点或数据价值等,应以有助读者推断数据内容、识别数据集特色和提升数据库(集)检出率为选定原则。
      关键词数量以3-5个为宜,可以是名词性的单词或词组。中文关键词不宜使用西文符号,中西文关键词应尽量采用规范术语,不宜使用过于宽泛、笼统、歧义和不规范的词语。
      关键词可以是如下词语的组合:
      l 数据所属的研究主题
      l 最能概括数据内容且可提高数据集检出率的术语(例如,数据集中的核心观测指标、独特的数据对象等)
      l 最能表达数据特色或其他可提高数据集检出率的词语
      l 具有特色或其他可提高数据集检出率的数据方法名称
      l 具有学术意义和检索意义的时空范围
      l 其他任何有助于推断数据内容、揭示数据特色、判断数据价值或提高数据集检出率的内容

    十三、 如何撰写数据论文的引言?
      “引言”指明数据产生的背景、数据概况和数据对所属研究项目、主题和学科领域的意义,初步回答“为何要生产当前数据库(集)”的问题。作者可以通过对当前数据生产背景(例如,数据所属研究或科学行动概况)、数据供需情况(例如,数据需求的紧迫性、数据的稀缺性或已有数据质量不足等)、数据特性(例如,高复现成本)、数据应用(例如,多学科或跨学科应用潜力)等方面的说明,为审稿人和读者初步判断数据价值与出版必要性提供信息。

    十四、 如何确定数据论文的作者贡献类型?
      论文需明确载明作者贡献,具体确定原则可参考表1。同一作者可有多个类型的贡献。

    表1 作者贡献类型*

    贡献要素类型

    定义

    概念化(Conceptualization)

    提出想法;制定或完善总体研究目标

    数据管理(Data curation)

    数据库(集)生产与管理,包括数据注释(产生元数据)、数据清理、数据(包括数据所需的软件)管理(含持久存档、共享和后续利用等)等。

    形式分析(Formal analysis)

    运用统计、数学、计算或其他技术对研究数据进行集成与描述性分析。

    资助获取(Funding acquisition)

    为论文发表、数据库(集)生成及所属研究项目争取资金支持

    调查研究与数据采集(Investigation

    开展数据相关的研究和调查活动,主要是进行实验或数据/证据的收集

    方法(Methodology

    开发或设计数据相关的方案、方法设计

    项目管理(Project administration

    管理、协调数据相关的研究活动,包括制定计划与具体执行

    资源提供(Resources

    提供或准备数据相关的研究资源,包括但不限于研究材料、试剂、患者、实验室样本、动物、仪器、计算资源或其他分析工具

    软件开发(Software)

    与数据相关的软件开发、测试、部署与运行

    项目监管(Supervision

    监管和领导数据相关研究活动的计划和执行,特别是数据共享策略与计划的制定

    验证(Validation

    数据验证、数据质量控制和其他与数据再现性有关的事项

    可视化(Validation

    出版工作的准备、创作和/或展示,特别是可视化/数据展示

    写作--论文撰写(Writing -original draft

    数据论文初稿撰写

    写作--评审和编辑(Writing -review & editing)

    数据论文评审与修改

      表中内容参照CRediT标准但根据数据论文特点有所调整

  • 发布日期:2023-08-04 浏览: 1407