当前位置:网站首页 > 国学 > 我国网络舆情研究的知识图谱 ——基于CiteSpace软件的可视化分析(上)

我国网络舆情研究的知识图谱 ——基于CiteSpace软件的可视化分析(上)

我国网络舆情研究的知识图谱 ——基于CiteSpace软件的可视化分析(上)可以预见,未来我国网络舆情的研究将在大数据及技术革新的引导下,以新媒体为核心平台,继续体现多学科交叉的思路特征;公共管理将成为网络舆情研究的核心学科力量之一

文|赵蕾

作者简介:赵蕾,管理学博士,华东政法大学政治学与公共管理学院副教授。研究方向:公共安全管理、绩效管理。

基金项目:国家社会科学基金项目(16BGL170)

【摘 要】运用知识可视化分析工具CiteSpace,对中国学术期刊网络出版总库(CNKI)中2639篇国内网络舆情研究论文进行文献计量分析,通过共现分析、聚类分析,在此基础上生成关键词的时区视图、战略坐标图以及突现图,可以补充和验证既往基于定性综述的研究结论,定量展示2013年以来我国网络舆情研究的演进路径、研究领域、研究主题和研究趋势等。经过十余年的发展,我国网络舆情研究积累了丰硕成果,已经进入平稳的发展调整阶段,但仍然存在若干研究局限与短板。可以预见,未来我国网络舆情的研究将在大数据及技术革新的引导下,以新媒体为核心平台,继续体现多学科交叉的思路特征;公共管理将成为网络舆情研究的核心学科力量之一,包括互联网治理、网络群体事件等在内的新型社会现象与治理模式,将结合数字化技术手段和实操工具探索,共同成为该领域的研究热点。

【关键词】网络舆情研究;知识图谱;CiteSpace;可视化分析

互联网进入中国已经25年有余,其发展态势有目共睹。“截至2019年6月,我国网民规模达8.54亿,普及率达到61.2%”。如今,被称为“新媒体”“第四媒体”的网络已经成为人们集聚、活跃的空间,它不仅是便捷的信息平台和社交平台,更是自我表达的有效载体,网络舆情问题应运而生,引起学界和政府的共同关注。

国内学界对网络舆情的关注始于2003年,至今已取得累累硕果。为了较为全面地梳理近年来我国公共管理领域网络舆情研究的进展与成效,本文借助CiteSpace等科学可视化软件,对中国学术期刊网络出版总库(CNKI)收录的文献进行系统的可视化呈现与演进分析。

1 数据来源与研究方法

1.1 数据来源

本文关注对于网络语境下公共舆情的研究,所有样本来源于中国学术期刊网络出版总库(CNKI),具体检索流程为:检索方式=高级检索;一级范围来源=期刊;二级范围来源=核心期刊+CSSCI;检索关键词=“网络舆情”或者“网络舆论”;检索条件=精确,最终检索到相关文献2684篇(检索时间为:2019年12月15日,未设置其他时间跨度)。考虑到分析效度与结论价值,人工剔除非学术类文献(包括综述、公示、各类通知和指南、书评等),最终得到有效样本2639份。

1.2 研究方法

科学知识图谱是结合文献计量法及信息可视化原理,以知识域为研究对象,显示某一科学知识发展进程与结构关系的一种图像,具有“图”和“谱”的双重性质与特征,显示知识单元之间交叉、互动、演化等多重复杂关系。与传统定性综述研究相比,基于知识图谱的理论和方法对文献定量计量和可视化,可使对研究进展的跟踪与评估更全面、直观、客观。

本文运用知识图谱工具,对我国网络舆情研究的现状与发展趋势进行分析。将所获得的文献样本进行数据转换,并导入CiteSpace,节点类型分别选择“keyword”“author”“institution”等,选用LLR寻径算法,生成相应的知识图谱。其目的在于:(一)通过绘制作者和研究机构的共现合作网络,发现我国网络舆情研究的主要科研力量;(二)通过关键词共现图谱和聚类分析,挖掘网络舆情研究领域的热点主题;(三)通过绘制关键词时区视图、战略坐标图和突现图,分析我国网络舆情研究发展的新兴趋势和演化路径。

2 整体分析

2.1 年度文献数量统计

文献年度分布分析,能够反映学科的发展速度和受关注程度,有助于整体把握该领域研究的年度分布和发展趋势(如图1所示)。

中国学术期刊网络出版总库_中国学术期刊网络出版总库_中国学术期刊网络出版总库在哪

首先,就发文量而言,可以直观看出我国网络舆情研究的热度和关注度整体呈上升态势。国内学界对于网络舆情的研究始于2003年,从现实层面来看,2004年“Web2.0”首次被明确提出,互联网用户的角色定位从原先的读者身份转变为允许制造网络内容的作者,成为网络舆论的强大主体,推动了网络舆情的迅速发展。

从2007年开始,相关的研究成果迅速增加,到2010年已经接近200篇。伴随着这种井喷式增长的,是一系列互联网里程碑式的发展阶段:2008年中国网民数量跃居世界第一,2009年新浪微博在中国实现普及。网络舆情的理论研究顺势步入了高度繁荣阶段,顶峰时期年度发文量已经接近300篇。

值得关注的是,从2017年开始,有关网络舆情的发文量持续降低,该领域研究的发文量是否会保持高位波动态势,进入研究的相对成熟期,抑或从此持续走低,进入低迷期,有待进一步的数据挖掘与分析。

其次,基金支持量则可以反映出本研究领域的社会关切和策应情况。2008年出现了第一个被国家社会科学基金支持的网络舆情研究的项目成果。截至本研究数据检索时,在2639篇数据样本中,有基金支持的文献共1081篇(支持率为40.96%),其中国家级项目基金是绝对主力军,包括国家社会科学基金支持文献510篇,国家自然科学基金支持文献300篇。考虑到数据分析价值,本文仅以国家社会科学基金支持文献和自然科学基金支持文献为分析样本。其变化如图1所示。

2.2 作者统计与共现分析

根据普赖斯定律(Price Law),核心作者发文数m必须满足以下公式:

经计算,在本研究的情境与数据统计下,核心作者的发文量应满足m≈5.2,考虑到研究需要,将发文在6篇以上的作者视为核心作者,共计41位(如表1所示)。可以看出,在我国网络舆情研究领域,福州大学陈福集、中国人民武装警察部队学院兰月新、华中科技大学曾润喜,以及吉林大学的黄微、许烨婧、刘熠、赵江元等学者都是这一领域的高产作者,发文量均在30篇以上。

中国学术期刊网络出版总库_中国学术期刊网络出版总库_中国学术期刊网络出版总库在哪

本研究进一步利用CiteSpace软件对本文检索的2 639篇文献进行作者共现分析(如图2所示),以此对网络舆情研究领域内合作关系的密切程度进行可视化呈现。

中国学术期刊网络出版总库_中国学术期刊网络出版总库_中国学术期刊网络出版总库在哪

图2显示,在CiteSpace中,节点选择“author”作为分析因子,生成作者合作知识图谱,图谱共生成 496个节点,每1个节点代表1位作者,节点大小表示该作者的发文数量,节点之间的连线则表示作者间存在合作关系,连线的粗细则代表作者间合作关系的密切程度。如表1及图2所示,知识图谱的网络密度仅为0.0024,除兰月新和曾润喜两位学者的中心性为0.01之外,其他学者的中心性均为0,图谱整体非常松散,没有形成联系紧密的合作网络。尽管形成了几个成果相对丰硕的研究团队(例如分别以兰月新教授、曾润喜教授、王国华教授和陈福集教授为首的若干团队),但主要以2~3人的合作规模为主,并且大多囿于同一机构甚至是同一导师间的局部合作,基本不存在跨区域合作。

2.3 机构统计与共现分析

要了解我国网络舆情研究的主要科研力量,还需要进一步对核心机构进行统计分析。根据研究需要,此处整理出了发文量在10篇以上的机构,共计19家(如表2所示)。在此基础上,将样本数据导入CiteSpace,以“institution”作为分析因子生成机构合作网络知识图谱(如图3所示),其中每个节点代表1个机构,节点大小表示该机构的发文数量,节点之间的连线表示机构间存在合作关系,以此对网络舆情研究领域内合作关系的密切程度进行可视化呈现。

中国学术期刊网络出版总库_中国学术期刊网络出版总库_中国学术期刊网络出版总库在哪

中国学术期刊网络出版总库_中国学术期刊网络出版总库在哪_中国学术期刊网络出版总库

由表2可知,网络舆情的研究力量大致可分为:地方知名高校(例如吉林大学、华中科技大学、福州大学、中国人民大学等)、部队信息研究的知名院校(例如中国人民武装警察部队学院)和社会科学院所(例如天津社会科学院舆情研究所)3 类。其中,华中科技大学舆情信息中心和中国人民大学舆情研究所已经发展成为国内重要的舆情研究机构,天津社会科学院舆情研究所出版了国内第一部研究舆情的基础理论著作《舆情研究概论——理论、方法和现实热点》,填补了该领域的空白。

由图3可知,合作图谱生成 449个节点,网络密度仅为0.0015,图谱整体仍然非常松散,仅华中科技大学、中国人民武装警察部队学院、福州大学具有一定的中心性,均为0.01,各机构之间缺乏交流,没有形成联系紧密的合作网络。

3 研究演进与阶段划分

关键词是对一项研究在主题、内容和范畴层面的高度概括,对高频关键词进行分析,可以直观地呈现该研究领域的热点主题。

基于CiteSpace软件,设置时间切片为2,阀值为top 50,选择LLR算法,生成关键词聚类时区图谱,以展示各聚类之间的关系及聚类中的文献历史跨度,在此基础上,对所获得文献进行分阶段的关键词共现分析,整理出现频次较高的关键词。

其中,图谱中结点的数量表示关键词的个数,节点/字体的大小与关键词的中心度和共现频次呈正相关,节点之间的连线表示关键词间的关联,连线越粗则说明关键词间关系越紧密。

3.1 总体发展分析

时区视图是依据某个研究领域各个热点主题之间的交互作用及突变关系设计的,有助于挖掘该研究领域的演变轨迹与阶段性特征。图4为本研究基于CiteSpace软件绘制的网络舆情研究时区视图,从时间维度上直观呈现网络舆情研究的阶段性热点和发展脉络。

中国学术期刊网络出版总库_中国学术期刊网络出版总库在哪_中国学术期刊网络出版总库

结合图1和图4的分析,本研究将2003年以来我国网络舆情的研究划分为四个阶段:2003—2006年(萌芽期)、2007—2010年(上升期)、2011—2016年(繁荣期)、2017—2019年(调整期),分别析出文献28篇、354篇、1 581篇、676篇。进而将除萌芽期外的文献数据分别导入CiteSpace,对三个阶段的关键词进行共现分析与聚类分析,分别得出各阶段的高频关键词(如表3所示)。在此基础上,进一步运用LLR算法,对各阶段相关研究文献进行聚类分析,并生成各阶段关键词聚类表(如表4所示)与聚类图谱(如图5-1、图5-2、图5-3所示),并以此为基础,尝试探讨不同阶段研究热点的演化与变迁。

中国学术期刊网络出版总库_中国学术期刊网络出版总库_中国学术期刊网络出版总库在哪

中国学术期刊网络出版总库_中国学术期刊网络出版总库在哪_中国学术期刊网络出版总库

中国学术期刊网络出版总库_中国学术期刊网络出版总库在哪_中国学术期刊网络出版总库

3.2 2007—2010年(上升期)的网络舆情研究

利用CiteSpace软件对2007—2010年国内354篇有关网络舆情的研究文献生成关键词聚类表(表4)和聚类图(图5-1),可见Modularity Q值为0.7144>0.3,网络聚类结构显著,Mean Silhouette值为0.8195>0.5,说明网络聚类内部同质性较高。利用LLR 抽取关键词并进行自动标识,此次聚类共导出7个聚类,聚类标签包含网络舆论、网络舆情、意见领袖、网络传播、第四媒体、舆论监督、突发事件等词语,显示了学者对网络舆情进行研究的不同层面。

这段时期是网络舆情研究上升期。由表3、表4、图5-1显示内容结合文献研读可知,这一时期我国学者主要聚焦于网络舆情的含义、特质和传播模式,并初步形成了有关网络舆情的规范理论体系。例如,在学者邓新民于2003年初步描述了网络舆论的概念后,刘毅教授对网络舆情概念作了合理的解释,认为舆情是由个人和公众,在一定社会空间内,对自己关心或与切身利益相关的各种公共事物所持有的情绪、意见和态度交错的总和。而网络舆情就是通过互联网表达和传播的各种不同情绪、态度和意见交错的总和。网络舆情的特点与互联网的传播方式相关,即网络舆情具有自由性与可控性、隐匿性与外显性等特点。

3.3 2011—2016年(繁荣期)的网络舆情研究

利用CiteSpace软件对2011—2016年国内1581篇有关网络舆情的研究文献生成关键词聚类表(表4)和聚类图(图5-2),可见Modularity Q值为0.5546>0.3,网络聚类结构显著,Mean Silhouette值为0.6423>0.5,说明网络聚类内部同质性较高。利用LLR 抽取关键词并进行自动标识,此次聚类共导出10个聚类,聚类标签包含网络舆情、网络舆论、网络空间、日志挖掘、电子政务、网络媒体、政务微博、系统动力学、网络传播、舆情分析等词汇,显示了学者对网络舆情进行研究的不同层面。

具体说来,这一时期是我国网络舆情研究保持高度繁荣的一个时期,其聚焦领域开始由内涵解析和基础理论构建,向现实发展和问题应用的层面过渡。一方面,由新媒体平台构成的新型社会网络及其信息传播特征,引起了广泛的学术关注,诸如“网络空间”“大数据”“日志挖掘”“第四媒体”“网络谣言”“舆论引导”“舆情传播”“舆情分析”等关键词成为热点,也是在这一时期,包括各大高校、科研机构和社会机构开始致力于建设不同层面的舆情分析和研究中心;另一方面,在公共管理研究领域,新型社会网络带来的治理挑战成为难以回避的现实问题,而诸如“突发事件”“电子政务”“网络治理”“政务微博”“微政治”“政民互动”等一系列高频关键词,体现了学界研究对现实需求的充分回应。

3.4 2017—2019年(调整期)的网络舆情研究

利用CiteSpace软件对2017—2019年国内676篇有关网络舆情的研究文献生成关键词聚类表(表4)和聚类图(图5-3),可见Modularity Q值为0.6754>0.3,网络聚类结构显著,Mean Silhouette值为0.776>0.5,说明网络聚类内部同质性较高。利用LLR 抽取关键词并进行自动标识,此次聚类共导出6个聚类,聚类标签包含网络舆情、网络舆论、新媒体、突发事件、舆情传播、网络治理等词汇,显示了学者对网络舆情研究的不同层面。

由表3、表4、图5-3显示内容结合文献研读,可以认为,从2017持续至今的高位波动状态,意味着我国学界对于网络舆情的研究开始向调整及成熟期过渡。经过十余年的发展,有关网络舆情的基本理论体系、研究范畴和问题指向已经基本明确,决定一个问题领域生命周期和发展势能的,将是其与不同学科和领域的深度结合。在包括公共管理学在内的若干相关学科领域,如何吸纳包括模拟仿真、系统动力、数据挖掘等前沿科技,针对性地回应现实中层出不穷的舆情问题,成为2017年至今该研究领域的核心议题。

(未完待续。本文注释及参考文献略)

注:本文来源为《秘书》杂志及微信号“mishuzazhi”,任何媒介转载均须注明来源。在公众号页面回复关键词“最新热文”,即可查阅相关文章。

上一篇: 大外团委组织召开全国学联第二十七届委员会第二次全体会议精神学习会
下一篇: 学位多、学制乱,中国需要怎样的医学教育?

为您推荐

发表评论