当前位置:大学毕业论文> 专科论文>材料浏览

关于数据引用探析论文范文写作 开放环境下的数据引用探析相关论文写作资料

主题:数据引用探析论文写作 时间:2024-01-05

开放环境下的数据引用探析,这是一篇与数据引用探析论文范文相关的免费优秀学术论文范文资料,为你的论文写作提供参考。

数据引用探析论文参考文献:

数据引用探析论文参考文献 论文中怎么引用文献环境工程论文期刊引用格式生态环境保护论文3000

关键词:数据引用;科学数据;引用规范

摘 要:文章对开放环境下国内外有关开放数据引用的研究文献进行了系统梳理和总结,包括数据引用的发展历程、数据引用的关键因素及其互动关系,在此基础上进行分析与总结,并提出一些政策意见和建议.

中图分类号:G250文献标识码:A文章编号:1003-1588(2017)11-0128-03

随着科技出版业的变革及开放运动的深入开展,科学数据开放获取的基础环境已逐步形成.海量的数据源及丰富的数据环境使研究人员得以便捷地发布、发现、访问并获取数据,如何规范地引用数据自然也受到科学界和出版界的极大关注.

科学数据引用是指提供数据参考的做法,类似于研究者为印刷型资源提供参考文献的方式.数据引用是支持数据访问、共享和再利用的一种重要方法.通过数据引用,降低科学数据发现和利用的壁垒,提高研究过程的效率和透明度,同时数据与出版物的有效链接将有助于学术出版形式的创新,促进跨学科研究,降低科研成本,验证并创造新的研究成果.

1数据引用的发展历程

20世纪60年代末期,科学界成立了第一个科学数据档案库,设计者开始关注科学数据的获取、存储、格式和信息检索[1].之后,数据引用的理论和实践不断发展,大致经历了四个阶段(见表1).

1.1数据可描述与检索阶段

该阶段的发展集中在引文的作用以促进描述和信息检索.比较典型的是Archive系统,Dodd[2]建议参照美国书目参考标准ASBR,以系统一致的方式来描述数据集,其核心原则是通过作者、题名和版本字段来描述信息.

1.2数據可访问及获取阶段

受美国科学基金会N资助,Altman等[3]开发了第一个开源和开放获取出版的数据系统Virtual Data Center,即虚拟数据中心.该中心通过联邦机构支持持续访问并获取研究数据,数据引用集成到虚拟数据中心,每个数据集被分配一个永久标识符和地址,并支持所有的研究数据都能被引用,而且这些引用应当具有有效的外部链接,即具有网络可获取性.

1.3数据可验证及再现阶段

该阶段数据引用与出版生态系统有了更广泛的整合,其核心原则是引用应当支持验证数据可链接及支持被引用数据的再现.最具代表性的是Daterse Network系统,其被哈佛大学用作数据发布的基础平台,有数以百计的研究人员和机构通过该系统发布数据.

1.4与学术研究系统可集成阶段

该阶段重在用标准化的方式集成数据引用与学术研究.例如,Data Dryad、Figshare供科研人员分享科研数据的平台,科睿唯安(原汤森路透知识产权与科技事业部)推出数据引文索引(Data citation index).另外,美国国家科学总院(The National Academics)、国际科技数据委员会(CODATA)、数据引用综合组(the Data Citation Synthesis Group)等组织经过多年努力,使人们认识到数据包括数据引用是研究出版物不可缺少的一部分,要求数据仓储机构/出版平台提供持久链接以保证数据的长期可访问性.

2影响数据引用的关键因素

2.1政策和机构基础设施

随着科学研究逐渐向数据驱动型发展,越来越多的国际科学组织认识到获取、重用数据可以促进研究的高效性和有效性,提高公众的投资回报.科研资助机构、研究人员、政策制订者、出版商、数据管理者等,提倡建立数据集的相关基础设施,完善基础设施机制.如:数据政策、数据管理、起源追踪、永久标识符、元数据和引用协议等.

数据引用的前提是数据共享,在数据共享的基础设施和服务方面,协同合作非常重要.如:科学技术数据委员会(The Committee on Data for Science and Techonlogy, CODATA)、世界数据系统(World Data System,WDS)和科学数据联盟(Research Data Alliance, RDA)于2015年3月达成协议[4],协议要求CODATA关注宣传、政策和流程,WDS关注数据供给和管理,RDA关注自下而上的数据共享工具和技术支持.政策制定方面,最为重要的是相关法律法规的建设,以此营造一种良好的外部环境.

2.2技术基础

数据引用的技术基础专注于处理数据的基础设施、系统及标识符.如:XML归档系统、RDF(Resource Description Framework)和数据库、永久标识的使用、定义框架和本体发布数据、创建数据库仓储及提供对数据的访问等.其中粒度问题、版本控制和唯一标识符是关键影响因素.

2.2.1粒度问题.引用粒度水平代表了数据的可重复性和可检索性.引用可以是数据集、数据集中的一个子集,也可以是一个特定记录集.引用系统应当允许多层粒度的引用,适用于数据、数据集或记录集的粒度应因上下文信息、不同规模和类型的数据等实际情况而不同.如:一组由图像组成的数据集,图像离开上下文环境仍能使用,而在特定时间点的大气测量数据集离开了上下文就会毫无意义,这时就应给予不同类型的标识符.DCC指出,数据引用粒度以满足研究者需求为准,如有不准确的地方,则需要在文章中引用数据的地方,写明引用数据集的细节信息[5].

2.2.2版本控制.在数据的生命周期中可能会存在多版本的数据引用,如果动态数据集的变化过大或过于频繁,则难以追踪管理.好的版本控制可以解决诸如多版本系统的数据更新、同一数据集中引用多层粒度的问题,可以记录和跟踪数据的修改历史,可以使数据得以协作处理和共享.

2.2.3唯一标识符.数据引用唯一标识性,要求数据引用应当拥有一个机器可以识别的、全球唯一的、能够被广泛使用的可持续方法.随着唯一标识符方案的相继推出,出现了诸如数字对象标识符(DigitalObjectIdentifier,DOI)、统一持久资源定位符(Persistent Uniform Resource Locator, PURL)和文档资源钥匙持久标识符架构(the Archival Resource Key, ARK)等.这些方案提出了将唯一标识符与可引用的数据集建立映射关系,从而创建一组相关的元数据(如作者、版本、URL)用于引用数据.唯一标识符是数据引用的关键因素,但由于数据对象本身具有的多样性、动态性及边界模糊性,给标识符的分配带来了一定的困难,如何从根本上解决这一问题,还要冀希望于新技术的出现.

结论:适合不知如何写数据引用探析方面的相关专业大学硕士和本科毕业论文以及关于数据引用探析论文开题报告范文和相关职称论文写作参考文献资料下载。

网络经济环境对会计核算影响探析
摘 要:网络经济环境已实现高度的数字化和虚拟化,对于会计核算来说要实现实时化的动态核算与管理,加强核算与现代信息技术的融合、会计系统与业务管理系。

电力企业财务业务数据治理探析
摘 要:电费管理工作是供电企业的业务核心,电费核算又是电费管理工作的中枢,是一个跨部门的综合性财务管理工作,它影响着企业的安全,影响着企业的价。

电子商务环境下审计风险防范探析
摘要:当前我们正处于电子商务环境下,企业管理模式以及经营方式正发生着巨大的改变,会计信息系统正向着新兴的网络自动化模式发展。由此带来的审计风险也。

环境管理会计新模式探析
摘要:本文是对中国环境管理会计的新模式进行探析,当前社会的会计实践和传统的不再一样,现在的企业经常会牺牲自然环境,人类和谐,从而实现短期利润。所。

论文大全