5.运用PageRank思想的筛选方法
PageRank(网页排名)是一种由搜索引擎根据网页之间相互的超链接计算的网页排名技术,以Google公司创办人拉里·佩奇(Larry Page)之姓来命名。Google把从A页面到B页面的链接解释为A页面给B页面的投票,一个页面的得票数由所有链向它的页面的重要性来决定。也就是说,在实际计算PageRank值时,除了考虑网页得票数(即链接的纯数量)之外,还要分析为其投票的网页的重要性,一个网页本身的PageRank值越高,则它对其链出网页的推荐能力就越强。同时一个网页的链出网页越少,那么它对其中一个链出网页的推荐程度就越高。也就是说,PageRank还会根据页面链出总数平分一个页面的PR值。目前已有学者将PageRank思想运用到识别网络舆论领袖的研究中。
X.Song等人(2007)运用Influence Rank(影响力级别)算法来识别博客圈中的舆论领袖,这种影响力级别算法根据两个方面来分类博客:博客在网络中的重要程度;博客提供的信息的新颖度。在测量博客在网络中的重要性时,他们运用了PageRank的核心思想,在评定A博客的影响力时考虑了被A博客吸引的那些博客本身的影响力水平。Zhongwu Zhai等人(2008)在识别BBS中的舆论领袖时,首先提出了两种将用户聚类到不同兴趣领域的算法:基于版块的算法(FieldPR_Board)和基于文章链的算法(FieldPR_ChainClus ter),然后将Global-PR算法应用到每个领域。GlobalPR不仅考虑了每个用户的回复数,而且也考虑用户跟随者自身的显著度,实际上GlobalPR就是一个加权的PageRank。其中,基于版块的算法认为在某种程度上,BBS每一个版块就是一个兴趣领域;而基于文章链的算法认为一个用户回复文章链是由于他对文章链中的文章感兴趣,因此可以将文章链作为兴趣领域的基本单位。
运用PageRank思想的识别方法很好地利用了互联网现存的海量信息来挖掘舆论领袖,相比自我报告法等传统方法更具有科学性。这种方法最大的特点是在识别舆论领袖时,不仅考虑了舆论领袖在社会网络中被关注的程度,而且也考虑了跟随者本身在这个网络中的重要性。另一方面,这种识别方法还强调了舆论领袖的跟随者在社会网络中关注的人的数量,因为每个人的精力是有限的,一个人关注的人过多,那么分配给其中之一的关注度也必然大打折扣。然而,这种方法也存在着一定的缺陷,最大的问题就是忽视了文章或帖子的内容。以BBS为例,拥有高回复数的ID并不一定就具有高影响力,不应将用户间的回复关系简单地理解为支持关系。
三、识别网络论坛舆论领袖的基本原则
近年来,随着互联网在中国的日益普及,网络论坛越来越成为中国社会各阶层意见表达、情感宣泄和思想碰撞的重要渠道,植根于中国特殊国情下的中文网络论坛在人们的社会生活中发挥着越来越重要的作用。而在网络论坛影响力的发挥过程中,一个重要群体“论坛舆论领袖”扮演着至关重要的角色。正是由于论坛舆论领袖日益凸显的社会影响力,不同学科背景的研究者出于各自的目的,努力寻找着识别网络舆论领袖的最佳方法。然而,究竟什么才是最佳方法?该部分笔者将以天涯社区天涯杂谈版块为例,结合网络论坛的互动特点,在已有筛选方法的基础上,探讨识别论坛舆论领袖的基本原则。
1.应该根据研究目的和研究对象来选择适当的筛选方法
市场营销以及创新扩散的研究学者筛选舆论领袖,是为了利用他们的人际关系和良好的信誉来推广自己的产品;准确定位舆论领袖是其唯一目的,其研究对象多是产品讨论型论坛以及学习型论坛。而社会学和传播学研究者们筛选舆论领袖,更多的是为了能够正确认识舆论走势,对社会舆论进行引导;研究不仅需要找准舆论领袖,而且需要了解舆论领袖所处的社会网络关系,其研究对象多是讨论社会民生问题的时事论坛和时政论坛。在选择筛选方法时,应该综合考虑研究目的、研究对象以及研究的可行性。以天涯社区天涯杂谈版块为例,作为关注社会民生问题的论坛版块,其讨论的内容具有很强的社会性和新闻性,因此,论坛讨论主题往往变化大,主题众多,内容复杂。识别这类论坛舆论领袖的最终目的是为了进一步了解网络舆论领袖的特征,以利于构建和谐的社会舆论环境,因此,在筛选方法的设计上不宜过于复杂,要便于后续研究。此外,天涯杂谈以广泛的社会批评和文明批评为主要内容,在中文环境中探讨社会民生问题,词语的运用是非常丰富的,简单地量化计算词语传递的多少很难真正反映影响力传递的大小。
2.识别论坛舆论领袖应该考虑参与者不同的兴趣空间
网络论坛参与者之间的互动主要是因为参与者对帖子内容的兴趣,虽然不排除发帖作者自身的魅力,但更多时候,参与者的回复关系是建立在他们对内容的兴趣的基础之上,而不是原发帖的作者。一个论坛涉及不同内容的版块,即使是同一版块也会因为不同的兴趣点而聚集成不同的兴趣空间。因此,识别网络论坛舆论领袖应该首先考虑论坛参与者不同的兴趣空间,然后再在同一兴趣空间中寻找舆论领袖。划分兴趣空间的方法依据不同的研究对象有所区别,对于版块主题非常鲜明的论坛可以直接以每个版块作为一个兴趣空间,例如专门讨论化妆、服饰内容的版块;而对于主题较庞杂的论坛或版块则需要对其作进一步细分。以天涯杂谈为例,虽然版规中注明以社会批评和文明批评作为主要内容,但其主题实际涉及的范围却非常之广,对于这一类论坛版块,就需要划分更具体的兴趣空间。因此,在筛选舆论领袖之前应该先按主题将版块中的对话链进行聚类。