二 研究框架与方法
(一)研究框架
本文采用文献计量学的理论框架对基础设施脆弱性相关文献进行回顾性分析,即通过数学、统计学等计量方法,研究文献信息的分布结构、变化规律和定量关系,进而探讨科学领域的某些结构、特征和规律。[3]本研究首先采集样本文献信息作为数据源,文献信息包括文献发表时间、题目、摘要、关键词、作者、国家/地区、研究领域、期刊、参考文献等要素内容。
对于信息要素的数据处理遵循文献计量学中的两种典型范式:一是文献统计分析,以时间、区域、机构等要素作为自变量来把握研究成果的整体分布情况,属于统计学范畴,本文涉及样本文献的年度和国家/地区分布;二是要素间关系网络的分析,即以上述要素为节点,结合数据挖掘、图论以及复杂网络等相关理论,在特定分析情景下生成要素关系网络,网络结构的量化指标即反映出该研究领域的总体情况,本文涉及样本文献发文国家/地区合作网络的中介中心性、文献共被引网络的聚类图谱以及高频共被引作者信息的挖掘。
通过文献计量手段可以挖掘出现有研究的多种信息。文献共被引(Co-citation)网络聚类图谱中的显著性聚类反映出既定时间节点内形成的研究焦点,结合高频共被引作者及其文献中的观点、研究方法等内容,可对基础设施脆弱性领域的知识基础结构进行深入了解以及宏观把握。
(二)研究方法与工具
为实现文献计量结果的可视化,本文借助陈超美博士开发的引文可视化分析软件CiteSpace V。CiteSpace V着眼于分析科学分析中蕴含的潜在知识,是在科学计量学、数据可视化背景下发展起来的分析软件,通过可视化的手段来呈现科学知识的结构、规律和分布情况。它强调科学文献之间的引证关系网络,认为研究前沿的引文形成了相应的知识基础,与本研究的主要目的相契合。本文的文献信息要素网络通过CiteSpace V生成,按照不同的研究目的设置节点类型,形象地展示出文献信息的知识图谱。
(三)数据来源
由于基础设施脆弱性研究具有典型的多学科特征,因此选择学科覆盖广泛、收录多个研究领域深具影响力的学术期刊的Web of Science数据库为文献数据来源。数据库选择“Web of Science核心合集”,文献类型选择“ARTICAL”+“REVIEW”,检索主题设置为“Infrastructure Vulnerability”或“Infrastructure Fragility”。2018年11月18日检索,检索结果中最早出现的文献记录发表于1981年,考虑到1992年及之前的文献量较少,分布分散,并且和主题关联性不显著,故将样本文献分布时间段界定为1993~2018年。进行样本去重处理,得出样本文献共计3147篇。按照“全记录包含所引用的参考文献以及摘要”内容项下载文献信息,作为CiteSpace V的输入数据。