网络论坛公共表达与议题上升的结构研究
长期以来,网络论坛都被认为是公共表达的主要集散地。综合性论坛、报纸网站的专门性论坛、社会网站等都是公众进行意见表达和讨论的主要场所。论坛中的大部分讨论都形成了一个个的讨论串。讨论串是帖子的集合物,通常按照时间顺序从最初开始依次显示。用户可以发布任何主题来形成一个讨论串,并以此来吸引追随者公开发表他们的观点。但是除非人们表达的内容能够获得公众足够的兴趣和注意,否则它并不一定能引起广泛的传播。某些议题可以引起密集的回复,而另一些则只能引发少量讨论,甚至是零讨论。讨论串中的帖子数通常是对某一议题的公众关注度的反映。公众关注是舆论形成的一个关键因素。因此,探讨那些引发密集回复的讨论串的结构,对于理解舆论形成的过程来说是十分重要的。
本研究试图分析网络论坛中公共表达的结构,并探讨什么样的结构与讨论串中的帖子累积量相关。与以往的公共议题上升研究不同的是,我们主要关注公共表达的结构,而非对阶段差异或是传播内容的描述。网络论坛中的公共表达将被视为一种集体行动,在其中,论坛用户共同追求的是公众关注。在此,公共表达的结构是指讨论串中用户之间的互动规则。根据临界大众理论,这些互动的规则能够显示集体行动中的参与水平。
我们认为,讨论串中的帖子数量是与参与的异质性、集中度和时间性相关的。异质性和集中度的概念来自于临界大众理论,强调的是互动结构的关系层面。讨论串中用户之间的回复关系则显示了讨论串的特定动力学形态,并影响到累计的回复量。除了关系结构外,我们还将讨论时间结构对于参与水平的影响。
一、文献综述
(一)作为集体行动的公共表达
网络论坛中的公共表达是一种集体行动。集体行动通常被定义为,具有共同兴趣的人们为了追求某种公共利益而共同行动。这个定义包含了两个核心观点:首先是存在一些具有共同兴趣的人;其次,人们为了集体利益而共同行动。在网络论坛中,具有共同兴趣的人是通过发布在讨论串中的议题或主题,而集合到一起的。用户被吸引进来,就讨论串中的议题发表他们的观点。同一个讨论串中的用户通常就是那些在某一特定议题或主题上具有共同兴趣的人。因而,回复者们是积极的议题公众。网络论坛中的讨论串自然而然地集合起一批具有共同兴趣的人。
网络论坛中公共表达的共同利益为何?人们出于各种不同的动机发布主题,回复他人。但是他们至少都有一项共同利益,即想要在他们的讨论中吸引公众关注,否则他们没有必要将个人意见进行公开发表。而实现集体利益(例如公众关注)的途径就是吸引特殊用户,并激发密集讨论。因此,网络论坛中的公共表达是一种集体行动,人们通过这种行为分享在某一特定议题上的共同利益,并为了寻求公众关注而共同行动。
用户通过单个的帖子和集体的讨论串来寻求公众关注。公众对于具有大量回复的讨论串的平均注意力要高于那些回复量少的。那意味着,高回复讨论串中的议题更能抓住其他人的注意力。在这种情况下,用户才有动机将他们的观点贡献于讨论串建构中,因为每个人都能从建构过程中获益。另一方面,由于帖子从早至晚的序列性显示结构,相对于较晚的帖子来说,较早的回复更容易获得其他人的注意。因此,个体对于在讨论串中的回复的预期收益是由回复次序所决定的。Olson (1965)的“搭便车问题”,即理性的个体不会为了实现他们的共同利益而行动,在这一情境下也同样存在。按照预期,用户应当参与到讨论串建构中来获取公众注意。然而,公众关注是一种具有非排他性的公共利益。当期望有大量其他人也参与进来时,人们几乎不可能感知到,个体自己的发帖会在获取公众关注的概率上造成差别,即人们自身是否参与与获得该公共利益的关系不大。因此,用户们并不愿意在讨论串中进行回复。而且,兴趣更大的人倾向于在早期进行回复,因为讨论串中的回复时序使早期回复更容易被其他人看到。
临界大众理论在一定程度上处理了Olson (1965)提出的搭便车问题。它为预测集体行动的出现条件的提供了启示。根据这一理论,集体行动的概率取决于群体成员之间相互的决策,而群体成员则是嵌入在具有特定结构性特征的社会网络中的。本研究将显示,结构性特征是如何克服搭便车问题的,并最终使得讨论串被成功建立。我们将把对集体行动概率的预测拓展至参与水平,并确定时间性在集体行动过程中的重要性。
(二)临界大众理论和群体参与水平
临界大众理论最初是为了分析集体行动开始发生和自我为继的条件而提出的。上升和自我维持阶段的差异有助于预测集体行动之间的概率。网络论坛中的集体行动现象是假设已被给定的。在讨论串建构过程中,我们主要考虑由主贴所引发的回帖的累计数量,而非个体发帖的概率。回帖的累计数量反映的是在追求公众注意的讨论串中,群体参与的水平。
在临界大众理论中有两大假设。首先,集体行动催生了临界大众的发展,临界大众则被定义为全体大众中,一小部分做出巨大贡献的人,而相对地,其他人则仅有少量贡献。在网络论坛中也是如此。在网络论坛中,浏览者总是多于回复者,说明大部分有兴趣的成员都是“搭便车者”。其次,有兴趣的群体成员依赖于彼此进行决策。网络论坛中的讨论串设计使后面的回复者能清楚地了解前面的回复者所做的决定。讨论串中的时序结构使得彼此依赖的决策成为可能。根据以上假设,以下这些临界大众理论研究都已经对与本研究相关的群体异质性和社会网络的影响进行了分析。
1.参与的异质性
Oliver, Marwell和Teixeira (1985)认为在全体大众中,兴趣和资源的异质性在集体行动中扮演着重要的角色。正如理论中所假设的,只有少数个体促成了集体行动,而这些少数人则是最偏离于平均值的。因此,异质性与集体行动的程度之间具有正向的关系。这里的异质性是指兴趣和资源分布的多样性。Oliver等人主要关注的是分布的形成。异质性的大众为临界大众的发展提供了可能,而临界大众则被认为是集体行动成功的最重要的因素。分布的多样性越大,临界大众出现的概率就越高。
异质性的影响还取决于生产函数的形式。当个体决定是否出力时,他们主要考虑从该特定的贡献水平上,能够获得多少的回报。对于每单元贡献的边际回报都随着贡献的累积而增加的递增型生产函数来说,启动成本是相对较高的。由于时序的彼此依赖性,当边际回报高于他们的阀值时,人们更倾向于随后出力。因此,临界大众是启动集体行动的关键。异质性通过在早期阶段增加临界大众的可用性,使得集体行动的启动成为可能。
而对每单位贡献的边际回报随着贡献的积累而减少的递减型生产函数来说,启动成本相对较低。它更容易引发集体行动。然而,由于每单位贡献减少了随后贡献的边际回报,人们更少地倾向于参与到后期阶段。异质性开启了通往“时序效应”之路。时序效应意味着人们依次做出贡献,而集体行动的水平受到参与顺序的影响。由于在减速型生产函数中,对高兴趣水平的需求将会越来越大,因此最有兴趣的人(即临界大众)将被期望最后一个作出贡献,以使总贡献最大化。
在讨论串建构的过程中,由于帖子显示的时序结构,早期帖子更容易获得较多的公众注意,因此生产函数是减速的。进一步来说,个体回复的成本几乎为零。不论他们的兴趣水平为何,用户们都更倾向于在早期进行回复。因此,时序效应也应当被考虑。在Oliver, Marwell和Teixeira(1985)的理论中,个体按照时序进行决策,并且一次只做一项决策。当最有兴趣的群体成员首先为个体利益的最大化做出贡献时,他们将无法在以后的阶段提供额外的贡献。因此,这种情况将导致不理想的结果,因为具有低兴趣水平的人们不容易在后期阶段做出贡献。
然而,这一由时序效应所带来的问题能为网络论坛中讨论串的动态性所解决。具有不同兴趣水平的用户首先回复,使个体利益得到最大化。兴趣较低的回复者不会更深入的参与;而最有兴趣的回复者将在后期阶段对议题进行持续的讨论。这一过程将引起额外的回复,导致讨论串的成功建立。在网络论坛中,兴趣的异质性是由参与的异质性所反映的。最有兴趣的人是那些在讨论串建构过程中参与得最频繁的人。因此,参与的异质性表明了在讨论串中,临界大众的出现,及额外回复的概率。
H1:参与的异质性水平对讨论串中的帖子数量具有正向影响。
2.参与的集中度
Marwell, Oliver和Prahl (1988)发现,网络集中度能增加异质性群体中集体行动的速度。他们认为,个体在社会网络中的组织方式影响着组织者,即少数巨大贡献者出现的概率。如果潜在的贡献者之间的社会联结是被集中化的,而非平均分散在整个兴趣群体中的,要协调集体行动将更加容易。集中度观点背后的逻辑是,集体行动的前景是建立在组织者能否在有兴趣的个体的网络中激发起足够多的贡献者这一基础上的。除了集体行动的前景之外,集体行动的程度则是依赖于最有兴趣的人是否能被组织起来,聚焦于公众利益的追求。
在网络论坛中,回复者们是被讨论串中的议题组织起来的。讨论很少是刻意地由一个指定的主持人所协调的。讨论串是一个自我组织的系统,而议题在其中扮演了组织者的角色。有兴趣的论坛用户被议题所吸引,发布了主贴。因此,“歪楼”(指使讨论偏离主题)的帖子可能会得到一些注意,并打断讨论串建构的过程。议题协调着讨论。参与的集中度则是指这样一个概念,即论坛用户只回复讨论串中的前几个帖子,这表明讨论从本质上来说,是聚焦在特定主题上的。用户被组织起来追求公众注意。在讨论串中,被回复地最多的用户是那些在讨论串建构过程中,通过回复关系与临界大众建立起联系的人。是临界大众重复不断地回复给特定的帖子,带来了成功的讨论。因此,回复的集中度说明讨论串中的讨论是被很好地聚焦和协调了的。
H2:参与的集中度水平对讨论串中的帖子数量具有正向影响。
3.参与的时间性
Oliver, Marwell and Teixeira(1985)含蓄地提到了对集体行动做出贡献的时间性的重要性。他们的其中两个论点是与参与的时间性相关的。第一个就是时序性决策的假设,而第二个就是时序效应。这两个论点都认为,参与的时序或顺序在集体行动中十分重要。然而,连续参与之间的持续时间的影响却没有得到太多的关注。
在网络论坛中,生产函数是递减的。潜在的回复者被鼓励在早期阶段进行回复。这意味着,在讨论串建构过程中,大部分的兴趣群体成员被期望尽早参与到讨论中。因此,如果在讨论串建构的整个过程的早期阶段有更多的回复者,则兴趣个体的数量将会越大。而且最有兴趣的人更可能在后期阶段有更多的讨论。换句话说,回复越密集,讨论串的建构越可能成功。
H3:两个连续回复之间的平均间隔对讨论串中的帖子数量具有负向影响。
二、研究方法
(一)数据收集
本研究的数据来自于中国最知名的网络论坛之一www.kdnet.net,这是由一家商业媒体在2000年创设的。我们选择的讨论串是于2012年被发布在政治和社会议题版面上的。样本数据在2011年10月1日至2012年9月30日之间被随机选取,以构成两个周(即,两个周一、两个周二……被随机选取)。所有在“组合周”中开始的讨论串都被收入,而所有在2012年10月1日之前,在这些讨论串中被发布的帖子(即主帖和回帖)也都被进行了收集。最终,包含了3011个帖子的110个讨论串被选为样本。在一个讨论串中的最小帖子数为2,最大帖子数为146,中位数为18.50,均值为27.37,而标准差为26.97。发帖人的用户名、发帖人回复对象的用户名,以及发布时间都被进行了编码(见表1)。
表1 数据格式
(二)测量
参与的异质性由在一个单一讨论串中,不同的用户所发布的帖子数的标准差来进行测量。标准差大意味着讨论串中参与的异质性水平更高。我们使用PHi来代表讨论串i中参与的异质性,即
式中:Ni是讨论串i(从1至110)中个体用户的数量;nij是由用户j在讨论串i中发布的帖子数量;mi则是不同用户在讨论串i中发布的帖子的平均数。
参与的集中度是由在一个单一讨论串中,用户被他人回复的频次的不等性来测量的。不等性显示了一些帖子或用户在随后的回复中是被提到最多的。相等性是由H统计量来计算的:
式中:pij是用户j在讨论串i中被回复的次数的比率。由于讨论串中帖子的数量是不同的,为了能进行比较,我们通过除以ln(1/Ni)将H统计量进行了标准化。H统计量的值越大,被回复的用户的分布越均匀。因此,讨论串i中参与的集中度即为
参与的时间性(PT)是由在一个单一讨论串中,连续回复之间的平均时间间隔来进行测量的。我们也把时间间隔称为事件间时间或等候时间,即两个连续回复之间的时间间隔。考虑到事件间时间通常是对数正态分布的,在我们计算均值时也对其值进行了对数正态转换。
三、研究结果
本研究首先描述了公共表达的结构;其次是分析结构与讨论串中的帖子数量之间的关系。
(一)描述性统计
表2显示了,平均而言,该论坛中的一个讨论串是由近30个帖子组成的。50%的讨论串的帖子数低于19,而只有3%的讨论串的帖子数超过了100个。帖子数的对数是呈正态分布的。一般来说,只有少数几个讨论串得到了足够的公众注意。在110个讨论串中,总的参与者数量为2516个,每个参与者平均发布了超过1个(1.20)的帖子,而只有不到19%的参与者在讨论串中得到了其他人的回复。事件间时间的均值是4.34小时(SD=22.16),从0至504小时不等。50%的等待时间是少于17分钟的。这意味着有一半的评论是在上一条帖子发布之后的17分钟内做出的。
表2 零阶相关性、均值和标准差(N=110)
∗p< 0.05, ∗∗p< 0.01(2-tailed)。
参与到各个讨论串中的个体用户的数量从2名到116名不等,均值为22.87(SD=20.96)。在50%的讨论串中,参与者少于16名。这一结果与临界大众理论相一致,说明只有少部分的人做出了较大的贡献。在各个讨论串中得到回复的个体用户的数量则从1名到21名不等,均值为4.30(SD=3.34)。在50%的讨论串中,只有少于3名的用户得到了回复。这意味着在大部分讨论串中的讨论都有较好的聚焦性。在大部分情况下,只有少数活跃的用户才会反复地回复数个其他用户。
由于超过90%的参与者只发过一次贴,异质性的均值相对较低,从0到5.37不等,其均值为0.53。50%的值是低于0.35的,而其中只有14%超过了1。有10%的参与者发帖超过了一次,他们就是讨论串中的临界大众。从理论上来说,参与者集中度的最大值是1。而实际上,其均值为.76;其中有50%以上是大于. 80的。这说明了,在讨论串中的讨论得到了较好的组织。一个讨论串中的两个连续回复之间的平均间隔则平均少于1小时(47分钟),分别从4.87分钟到27. 75小时不等。其中有50%是超过了37分钟的。
(二)假设检验
本研究的主要目的是分析具有大量回复的讨论串的结构特征。因此,我们对异质性、集中度和时间性在发帖数量上的效应的进行了回归。我们将发帖数量进行了对数转换,以满足多元回归分析中因变量呈正态分布的要求。回归方程式为
Lg (NO. of posts)=constant+b1×PH+b2×PC+b3×PT
为了检验在三个自变量中的多重共线性的可能,我们计算了其方差膨胀因子(VIF)。表3显示了其值大大小于阀值5。因此,在本研究中不存在多重共线性的问题。
根据假设1~3, PH和PC与发帖数量呈正相关,而PT则与讨论串中的发帖量呈负相关。因此,b1和b2必须显著大于0,而b3则必须显著小于0。分析结果如表2所示,可知所有的假设都得到了支持。在任何给定PC和PT的情况下,PH每增加一个单位,讨论串中平均增加1.35个帖子。在任何给定PH和PT的情况下,PC每增加一个单位,发帖数量平均增加2.7。在任何给定PH和PC的情况下,PT每增加2.7小时,发帖数量平均减少0.60。各系数都在0.01的水平上显著。
为了评估每个变量的个体贡献,除了全模型,我们还建立了三个单独的回归模型,如表3所示。每个模型都排除了三个变量中的一个。那么与全模型相比,降低了的R2就是被排除掉的变量对于解释发帖数量变异的个体贡献。例如,为了评估PH的个体贡献,我们可以计算包含了PC和PT,而排除了PH的那个模型的R2。表3显示了三个变量可以解释68.5%的发帖量变异。参与时间性则是最重要的一个因素,能够独立解释21.4%的发帖量变异,其后则是异质性,能解释6.4%,而集中度则只解释了2.5%。
表3 对数(帖子数量)的普通最小二乘回归
∗p< 0.05, ∗∗p< 0.01(2-tailed)。
四、讨论
(一)总结
总的来说,我们分析了网络论坛中的公共表达的结构特征,以及该结构与公共议题上升之间的关系。论坛用户为了在建立讨论串的过程中吸引公众关注,而参与到政治和社会议题的讨论中。在本研究中,大部分的讨论串只得到了少量的公众关注,反过来说,只有少数的讨论串中包含了大量的讨论。正如临界大众理论所提示的,大部分的讨论是产生在少部分的用户之中的。一般而言,参与者只发布一个帖子,他们是从那些在讨论串建构过程中,发布了超过一个帖子的积极参与者身上沾光的“搭便车者”。
在临界大众理论的框架下,我们详细讨论了三个方面的结构特征:参与的异质性、集中度和时间性。我们发现,如果用户参与具有异质性,集中在被讨论的议题上,并且帖子是在讨论串建立过程的早期被密集发布的,那么,在讨论串中将会有较多的帖子。我们的研究表明,公共议题的上升将受到以下几个因素的影响:是否存在具有不同兴趣程度的异质性的参与者;讨论是否被较好地组织和聚焦;以及讨论串是否在早期阶段就吸引了众多追随者。
在三个因素中,时间性是最重要的一个。如果在早期阶段有更多的回复,则表示将存在更多潜在的有兴趣的用户。在一个讨论串中,有兴趣的人群的数量反映了发帖的密集度,并进一步决定群体参与的水平。基于这一点,由参与异质性来表现出的积极的参与者将在后来发布额外的评论。这意味着,在讨论串建构的过程中,兴趣群体的规模将在最大程度上决定议题是否“热门”。然后,积极参与者的数量将影响议题“热门”的程度。在整个过程中,讨论必须被很好地聚焦在主题上,或是围绕着特定的用户。
(二)不同的理论解释
网络论坛讨论串中的参与时间性,可能是以迅速发生的事件的“爆发”这一概念为特征的。而爆发则是与长期静止相区分的。Barabasi (2005)认为,人类活动的时间性表明了被迅速执行的大部分任务的“突发性”,相反地,只有少数任务会经历长时间的等待期。显然,在网络论坛讨论中也是如此,讨论串中的大部分讨论是在早期阶段被迅速引发的,而在后期的长时间中只有少量的帖子被进行了回复。然而,在Barabasi(2005)最初的研究中,他并没有提到爆发期和不活跃期的次序。在本研究中,帖子的平均增长速度在早期要快得多(见图1)。而且,其内在的机制也有所不同。Barabasi (2005)的解释模型是建立在排队过程的基础上的:个体是在一些感知优先的基础上执行任务的。但是在我们的研究中,活动之间没有差异,不需要在执行上被进行排序。而且该模式描述的是一种由不同的用户来建立讨论串的集群现象,而非个体的行为轨迹。
图1 110个讨论串中帖子数量的增长轨迹(时间由分别除以讨论串中的最大值进行标准化)
传播的顺序性结构看上去也与Krassa (1988)的“观点表达的阈模型”有关,它是在Granovetter的“集体行为的阈模型”基础上发展出来的。它认为,一个人是否会公开表达一种观点,是取决于该个体的阈值(个体特征)和回应的聚集水平(舆论气候)的。Glynn和Park (1997)进一步阐明,个体阀值作为该人观点强度的一种功能,是受到对社会孤立的恐惧的调节的。在讨论串建构的情境下,后回复者的决策时受到那些在讨论串前面的人的影响的,而早期回复者的观点表达阈值必须低于追随者的。但是观察到其他的一些现象可能与阈模型的假设有所冲突。首先,该模型假设前人的决定将影响到后来者。该机制的产生是由于对社会孤立的恐惧。然而,在网络论坛中并非如此。网络论坛与面对面的环境是有所差异的,在网络上几乎不存在规范性压力。论坛用户倾向于在反对那些在前人的帖子出表达出的观点时进行回复。实际上,在网络论坛中,我们可以看到众多的激烈争论和辩论。有许多关于网络政治讨论的实证研究发现,讨论十分地针锋相对。其次,阈模型假设,如果不存在外部影响(如舆论气候)的话,人们是渴望去表达的。在支持的数量超过其阈值时,人们为何会说出其个人的想法?我们的模型认为,人们公开表达观点是为了吸引公众关注,而公众关注则能影响到后续的政策制定。因此,具有不同立场的用户之间相互竞争,而非寻求一致。当他们面对对立观点的主导的,理性的用户更希望大声疾呼,而非保持沉默。第三,阈模型假设,个体不被允许做出重复的选择。根据本研究的结果,在一个讨论串中发布超过一个帖子的临界大众对于讨论串的成功建立是十分重要的。
五、局限性和未来研究建议
本研究还存在一些局限。首先,尽管我们的研究显示了,迅速出现的回帖通常将增加讨论串成功建立的概率,但是其解释仍然比较模糊。显然, Barabasi (2005)的模型对于本研究来说并不合适。而事件间时间均值的测量并未从时间顺序上表明时序信息。通过现在的模型,我们还不清楚迅速的回复是否是发生在早期阶段的。显然,根据对讨论串中帖子的增长轨迹的描绘,在大部分情况下,帖子数量在早期阶段增加地更快(见图1)。然而,仍然有一些例子表明,增长速度在整个过程中是保持一致的。这意味着,增长轨迹是线性的。未来的研究可以改进新的测量方式,来探索讨论串建构过程中的详细特征。
其次,我们对参与集中度的测量是建立在参与者,而非帖子(即内容)的基础上的。参与者和内容二者在讨论串建立过程中,都可能是重要的。我们证实了,聚焦在特定参与者上的讨论显示出对讨论串建构程度的影响。然而,我们假设其内在机制是,讨论是被很好地组织和聚焦在同样的主题上的。未来的研究可以检验参与者集中度和主题集中度之间的差异和关系。
再次,现在的模型还无法预测讨论串中帖子的数量增长。我们只是概述了具有大量回复的讨论串中的公共表达的结构特征。我们并没有说明,在它们之间是否有任何因果关系。我们知道,公共议题的上升是与讨论的特定特征相关的,但是这一分析是静态的、共时性的。未来的研究可以采用更成熟的分析,通过动态模型来描述和预测帖子数量的增长轨迹。
作者:薛可、梁海、陈晞、余明阳
原载于《上海交通大学学报》(哲学社会科学版),2013年第2期