当前位置:大学毕业论文> 硕士论文>材料浏览

关于信息检索论文范文写作 基于Prefuse和社会网络算法的信息检索学科合作网络相关论文写作资料

主题:信息检索论文写作 时间:2024-01-27

基于Prefuse和社会网络算法的信息检索学科合作网络,关于免费信息检索论文范文在这里免费下载与阅读,为您的信息检索相关论文写作提供资料。

信息检索论文参考文献:

信息检索论文参考文献 文献信息检索信息检索论文信息网络安全杂志网络信息安全论文

摘 要:通过构建基于Prefuse的知识图谱系统框架,在此框架基础上采用社会网络算法构建信息检索学科合作网络知识图谱并进行了分析.发现信息检索研究人员在高产、高被引和高合作群体中不存在很强的一致性.合著网络中形成以Zhang, L、Sprink, A和Schacter, DL为中心的最大规模科研群体,以Tulving, E和Cabeza, R为代表的凝聚力最强的合作群体.

关键词:Prefuse 社会网络 知识图谱 信息检索 合作网络

中图分类号: G254.9文献标识码: A 文章编号: 1003-6938(2012)05-0079-06

近年来,随着多种知识图谱分析工具的出现,一些研究者利用知识图谱软件(主要是CiteSpaceⅡ)对信息检索学科进行了分析,如Rorissa A和Yuan X(2011)在2000~2009年数据的基础上用CiteSpaceⅡ对信息检索学科进行知识图谱构建和学科分析[1];国内同样有学者利用该软件对信息检索的子领域进行分析,但这些研究存在数据源时间跨度短、在一定程度上依赖于知识图谱软件的功能,而且未对信息检索学科合作网络进行分析研究.通过上述考虑,本文尝试一种新的知识图谱框架,基于该框架通过社会网络算法构建信息检索合作网络并进行解读,以便为国内外从事信息检索研究的有关学者提供参考借鉴.

1 基于Prefuse的知识图谱系统设计

2005年,Heer J、Card SK、Landay JA三人共同撰文提出了Prefuse的信息可视化框架[2].Prefuse为数据建模、数据可视化以及用户交互提供了丰富的软件库,可以支持表格、图和树显示,还具有支持动态显示、动态查询等功能.Prefuse基于传统的MVC架构进行开发,其可视化时需要经过如下处理过程[3]:

(1)抽象数据(Abstract Data).Prefuse对数据进行可视化的首要步骤是获取数据,并为数据提供了指定的接口和程序,可以显示表、图和多种树形结构.本文主要使用XML格式的数据,通过把数据转化成XML格式,如DOITrees、GraphML、TreeML格式,完成抽象数据的处理过程.

(2)数据过滤(Filtering).主要是将抽象数据进行提取、转化,使其适用于显示.首先选取要进行可视化的一系列元素,如一个图形或显示在散点图上的重点区域.然后形成一些可视化的属性(称为VisualItems),如源数据中显示的文字、数字,显示时的坐标点、颜色、大小等等.然后通过Action提供为上层组件.

(3)数据渲染(Rendering).即图形绘制的过程,可视化元素(VisualItems)通过渲染器(Renderers)绘制到屏幕上,其中用到上面形成的组件如颜色、位置、大小等等.Prefuse实现了一些基本渲染器,通过渲染器工厂RenderFactory进行管理.

(4)交互显示(Interactive Display).功能由Display组件完成,用于显示ItemRegistry中注册的组件.可视化交互功能通过ControlListener接口实现,主要是提供对鼠标、键盘的监听功能.

本文通过对数据的预处理、数据抽取、矩阵形成,进行聚类或社会网络以后,把生成结果转化成Prefuse可支持的TreeML、GraphML格式,借助Prefuse可视化框架,完成聚类显示、社会网络显示的功能.

2 信息检索学科分析的知识图谱构建

2.1 数据源获取

本研究数据来源于Web of Science的SCI-EXPANDED、SSCI、A&HCI、CPCI-S、CPCI-SSH数据库,用“Information Retriev*”作主题检索,检索时间选择20世纪50年代至今(截止至2011年11月25日),词形还原打开,得到的检索结果共计46561条记录.以此作为构建信息检索学科知识图谱的数据集,以下简称为“数据集”.

2.2 数据处理

(1)提取作者数据.在原数据库中,通过数据表paper的“authors”字段,可以获得每篇文献的作者数据,在作者字段中,为方便去重和区别不同作者,每个作者姓名以数据集中提供的全名进行表示,当文献是合作文献时,作者之间以分号进行分隔.选择paper的“authors”字段的所有数据,通过编程对获取的每个作者条目进行切分,从而得到所有作者数据.

(2)构建合作者对应关系.建立表author_author,其中包括两个字段“firstauthor”和“secondauthor”.通过处理,共得到548,182条作者与作者对应数据.在构建“作者——作者”对应表时,第一作者与第二作者及其他作者不分权重,即所有作者的重要程度相同.构建作者与作者对应关系表时,通过对步骤一获得的每一条合作者数据进行遍历,得到作者与作者对应关系.

(3)生成合作者数据.对表author_author中的数据,根据“firstauthor”字段进行分组合并,对“secondauthor”进行合并,合并过程中剔除重复元素,“secondauthor”对应数据以分号进行连接,同时统计出每个作者的合作次数,然后将合作者数据插入表coauthor中.

处理完成后,共得到96,778个作者的合作者信息,其中与其他作者合作频次最高的为Bryant, Stephen H.,合作频次为245.与其他作者合作频次达到200次以上的作者共22人(见表1).

2.3 合作者网络构建

由于本文的研究重点是确定合作者中的团体和其研究内容,所以文中采用无向无权网络,构建过程如下:

(1)定义社会网络数据结构.合作者网络的定义包括节点、边和社会网络三个部分.节点包括aid和aname两个字段,为网络中最基本的构成元素,由类Node表示;边由节点和与该节点关联度为1的节点的集合构成,其中与该节点关联的节点数即为该节点的度,由类Edges表示;社会网络由节点的集合和边的集合两部分构成,其中社会网络还可以获取子网络,由类SocialNetwork表示(见图1).

结论:关于对写作信息检索论文范文与课题研究的大学硕士、相关本科毕业论文信息检索论文开题报告范文和相关文献综述及职称论文参考文献资料下载有帮助。

信息时代校企合作网络教学在高校中运用
摘 要:以郑州财经学院与正保远程教育的合作进行研究,旨在设计出适合我国高校教育中使用的能够面向课堂的网络教学系统,促进我国的新课程改革,并在教学。

我国P网络借贷平台信息披露现状
一、引言P2P网络借贷平台是互联网金融的一种,它的主要职能是为出借人和借款人提供投融资平台,其经营业务可以纳入金融活动范畴,理应与传统金融行业。

论网络购物中信息隐私权保护
摘要:网络购物已经融入到人们的日常生活中,成为我们越来越重要的消费方式。但是由于互联网络自身的特点,消费者的个人隐私极易受到侵害,而且危害程度较。

社会压力和环境信息披露
摘 要:披露环境信息是企业自身与社会进行对话的途径,也是其在“资源节约型、环境友好型”社会中生存与发展的必要条件。充分披露环境信息,是环境治理的。

论文大全