知网查重样例–著者主题词耦合关系构建
发布时间:2017-08-15 点击率:0
本文在分析了基于语义的信息检索研究现状的基础上,将共现分析引入语义信息检索,提出基于共现分析的语义信息检索的模型,并以实验验证其提升馆藏资源的检索效率,提高用户使用数字图书馆的满意度。
在上述模型中,分析器的主要分析对象就是著者主题词的关系,若要实现用户检索时的著者主题词关联,首先要实现的就是挖掘出馆藏资源中著者和主题词之间的关系。分析器按下列步骤进行:
(1)构建著者主题词共现网络每一条馆藏资源条目都有著者和主题词项,每个著录项都是由编目人员经主题标引得来,主题词是经过受控词表主题标引的,具有规范、科学的特点,一般三到五个不等,每一个著者都可对应多个主题词,每一个主题词也可对应多个著者。若著者和主题词共同出现一次,则把著者和主题词用一条线连接在一起,这样便可形成多个著者和多个主题词用多条线连接在一起的一张网络图。
首先,利用自编VBA程序,将91个主题词和82位著者一对一共同出现的次数形成一个91*82的共现矩阵,将共现矩阵导入UCINET软件,用NETDRAW形成的共现网络如图3所示。图中方形代表著者,圆点代表主题词,有箭头的线条代表著者主题词之间有关系。图3著者主题词共现网络图
(2)构造共词矩阵及聚类08
图3中91*82的矩阵用社会网络分析软件呈现出的网络图已经让人眼花缭乱了,若是更大的学科得到的更大的矩阵,呈现的网络图则会更加复杂。因此需要将主题词进行聚合,这里不进行语义层面的深度聚合,只示例性地用主题词共现的次数构造共词矩阵,后用SPSS软件进行聚类分析。利用聚类树图,可以将所有91个主题词划分成11个类团,归纳得到类团大致代表一个研究领域。
3) 构建著者主题领域共现网络
按照构建著者主题词共现网络的原理,同样可以构建著者主题领域共现网络,将91个主题词分别归并入各自所属的类团,用VBA自编程序得出类团和82位著者分别共现的次数,形成11*82的共现矩阵,后得到著者主题领域共现网络。
本体应用于语义信息检索的研究还有更宽更广的领域可以探索。本文仅以共现分析为方法探索语义信息检索,也仅以作者关键词为例进行实验和展示,而本体的应用领域之广泛,是无法使用单一的技术和方法来概述的,因此还需要倾注更多的学者和科研人员的才华和智慧来发掘探索更宽广的领域。
本文将共现分析应用于语义信息检索,还有诸多不尽人意之处,比如系统要随时更新这一领域的知识网络,这是对技术人员和系统软硬件的重大挑战,因此还有待更多的研究和探讨。
.—— END ——.