当前位置:大学毕业论文> 专科论文>材料浏览

关于文摘论文范文写作 基于被引片段识别科技文摘综述相关论文写作资料

主题:文摘论文写作 时间:2024-02-08

基于被引片段识别科技文摘综述,这篇文摘论文范文为免费优秀学术论文范文,可用于相关写作参考。

文摘论文参考文献:

文摘论文参考文献 高被引论文绿色科技杂志科技小论文500字关于科技的论文

[摘 要][目的/意义]基于被引片段识别的科技文摘生成是文献计量学、信息检索和自然语言处理等领域共同关注的研究问题.通过梳理相关成果,可为后续研究提供借鉴.[方法/过程]本文首先介绍被引片段概念,进而从被引片段识别和分类、文摘生成和评价等步骤对相关研究进行综述.[结果/结论]当前被引片段识别总体上可以分为机器学习和检索两类,分面判定还存在标准不一致的问题,摘 要生成和评估方法相关研究较欠缺.

[关键词]被引片段;科技摘 要;引文上下文

科研工作者在科学研究活动中通常需要阅读大量科技文献以了解研究领域现状.在当前学术论文数量和日俱增的情况下,通过阅读科技文献的摘 要将大幅度减小科研工作者阅读文献的压力.当前科技文献摘 要的形成过程可分为作者撰写和自动生成两种方式.前者虽然能精准地概括文章的核心内容,但由于其是从作者角度而非读者角度完成的,因此很难客观地反映该文对学界的贡献和影响.自动文摘作为一种自动凝练目标文献核心内容的方法,具有效率高和客观性强的特点,因而在信息检索和信息抽取等领域具有广泛的应用.按照摘 要和原文的关系的不同,自动文摘技术可分为抽取型文摘和理解型文摘,后者受当前语义理解和自然语言处理技术限制较大,所以目前关于自动文摘的研究主要集中在抽取型文摘上嘲.传统抽取型摘 要的做法是计算目标文献中各句子重要性并选取若干关键句生成文摘,这样生成的摘 要同样不能从读者角度反映该文的影响力.于是,越来越多的研究者尝试从引文角度考虑该问题闱.基于引文的摘 要技术的基本概念是引文内容,又称引文上下文(citation context),包含了对被引文献的介绍和述评,从读者角度揭示了被引文章对学界的影响.当前,如何通过引文上下文生成摘 要存在直接法和间接法两种思路,前者对目标文献的引文句进行组织进而完成摘 要生成,后者需从被引文献中识别出被引片段并对其进行融合,生成最终的摘 要.为方便对本文所评述自动摘 要方式有直观的理解,笔者归纳了摘 要的种类并绘制摘 要的分类图谱,如图1所示.

引文上下文是指引文标记所处的上下文,当前广泛用于引用动机识别、主题识别、信息检索、文档聚类等领域.直接使用引文上下文生成单文档文摘最早开始于2008年Qazvinian等的研究,作者对被引文献的引文上下文进行聚类和排序,从而生成被引文献的摘 要.Kaplan等将指代消解(corefcrenee resolver)应用于引文上下文的抽取,实验证明该方法相比于其他方法在抽取引文上下文时效果更优,抽取出的内容可进一步用于文摘生成.HUE21等将引文句视为文献的使用上下文,并将之和结构上下文组成混合引文上下文开展基于影响点的文摘研究.直接利用引文上下文生成文摘目前已有较多的成果,但引文上下文中除包含对被引文献的介绍和评述外还包含了施引者的观点,因此有学者指出直接使用引文上下文的文摘存在主题偏移和信息缺失的问题,因此基于被引片段的文摘生成受到越来越多研究者的关注.

基于被引片段的文摘研究最早开始于文献“GeneratingImpact-Based Summaries for Scientific Literature”,與直接使用引文上下文生成摘 要相比,这种方式生成的摘 要来自于原文,从而避免了主题偏移的问题.Mei利用文章的所有引文上下文构建其影响模型,在原文中寻找能反映该影响的句子,并加以组织生成文摘.Cohan通过对被引片段进行聚类,从各类簇中抽取重要性较高的几个句子形成文摘.在web of knowledge、Google Scholar平台上以检索式“cited spans summary”“reference text spans summary”等为关键词进行检索,发现相关结果并不多,大量的成果集中于2014TAC和2016CL-SciSumm的会议论文上.同时,国内针对被引片段的自动文摘相关成果则更加少.通过查找相关文献进行扩充,通过人工阅读共得到相关文献26篇.当前基于被引片段的文摘步骤可概括为两步:首先从被引文献中识别并抽取被引片段,并判定其在语篇中的功能;其次,从被引文献中抽取若干句子本文通过文献.本文首先用实例介绍被引片段的概念,接着以两次文摘比赛的步骤归纳和评述该领域研究现状,以期为后续相关研究提供借鉴.

1被引片段概念

在引文分析领域,“被引片段”是一个崭新的概念,是引文内容分析未来发展的重要的研究方向.单篇文献会包含多个研究主题,而其他文献在引用它时仅仅是因为某个主题.施引者会引用其认定对自己研究有参考价值的内容,这部分内容正是本文所述的被引片段(Cited Spans or Reference Span).一般认为,在一次引用过程中被引片段和引文上下文具有对应关系,相比于被引频次,被引片段更清晰和具体地说明了该文献对学界的贡献和影响,图2用实例说明被引片段的概念:

在图2中,施引文献C10-2104中被标注的句子就是引文上下文,文献C02-1025中被标注的句子为被引片段.文献C10-2104因为需要对“global features”来源进行说明而引用了文献C02-2105.此时,文献C02-1025中关于“global features”的描述语句“Global features are extracted from other occurrences of the same token in the whole document”则可称为对应的被引片段.在这次引用过程中,文献C02-1025中关于“global feature”的研究对文献C10-2104具有一定参考价值和借鉴意义.在单次引用中,被引片段从内容角度揭示了该文献被引用的原因,反映了该文献对后续研究的借鉴作用.通过组织和整合某篇文献的多个被引片段,即可全面地评估其对学界的影响,进而生成摘 要.

2被引片段识别和分类

2.1被引片段识别

结论:关于本文可作为文摘方面的大学硕士与本科毕业论文读者文摘精选100篇论文开题报告范文和职称论文论文写作参考文献下载。

支持驱动战略科技政策综述
摘 要:科技创新是实施创新驱动发展战略的核心内容和重点方向,应该大力加强对科技创新政策的研究。对支持创新驱动发展战略的科技创新政策研究从创新驱动。

国内外创业机会识别文献综述
摘要:本文按照创业机会以及机会识别的内涵-创业机会识别的前因及结果变量-创业机会识别的三大模型的思路梳理,总结了现有研究的不足,并对未来研究进行。

基于科技计划绩效评价文献综述
摘要:作为科技创新战略的先行军,科技计划囊括了科技战略实施的阶段目标,预算投入计划,定期成果反馈等重要因素,担负着十分重要的角色,是实施一系列国。

中小科技企业融资综述
摘要:中小科技企业已成为推动社会发展的重要力量,但是融资难依然是制约其发展的难题,本文对国内外中小科技企业融资相关文献进行梳理,以期对中小科技企。